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Para los poco versados en ciencia, la «entropía» —término de origen griego 
que significa «transformación»— es un extrano concepto que tiene que ver, 
vagamente, con el calor y la energía, el paso del orden al desorden, el 
aumento de la incertidumbre y la irreversibiIidad del caos. Sea como fuere, 
la entropía siempre parece estar creciendo. 

Los científicos, por su parte, precisan que la célebre segunda ley de la 
termodinámica (la que enuncia la entropía) establece que, en cualquier 
proceso espontáneo, es imposible convertir completamente el calor en 
trabajo, pues se pierde parte del calor. Pero por qué la naturaleza se 
comporta de este modo sigue siendo objeto de polémica, hasta el punto de 
que, en más de una ocasión, se ha dicho que la ley de la entropía constituye 
uno de los misterios más profundos de la física moderna. 

Escrito con el máximo rigor pero sin tecnicismos, este libro tiene como 
principal objetivo que el lector aplique sencillamente el sentido común y 
descubra que una de las leyes de mayor alcance en el universo es de una 
claridad meridiana. 

Explica asimismo la fascinante evolución de la noción de entropía a partir 
de los trabajos de Sadi Carnot, Clausius, Lord Kelvin o el gran Ludwig 
Boltzmann. Además, BEN-NAIM, una autoridad mundial en el campo de la 
termodinámica, formula una sugestiva interpretación de la entropía 
apoyándose en la noción de pérdida de información. 
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Prefacio 


Desde que escuché la palabra «entropía» por primera vez, me fascinó su 
naturaleza misteriosa. Recuerdo vívidamente mi primer encuentro con la 
entropía y con la segunda ley de la termodinámica. Fue hace más de cuarenta 
aiïos. Recuerdo el aula, la profesora, incluso el lugar donde me sentaba: en 
primera fila, frente a la tarima donde ella estaba de pie. 

Tras explicar el ciclo de Carnot, la efíciencia de los motores térmicos y las 
diversas formulaciones de la segunda ley, la profesora introdujo la intrigante y 
misteriosa magnitud conocida como Entropía. Me sentí confundido y 
desconcertado. Hasta entonces ella había expuesto conceptos con los que 
estábamos familiarizados: calor, trabajo, energía y temperatura. Pero ahora, de 
pronto, nos presentaba una palabra desconocida, nunca oída antes por nosotros, y 
que denotaba un concepto enteramente nuevo. Esperé pacientemente a poder 
preguntar algo, aunque no estaba seguro de cuál sería la pregunta. ^Qué es esa 
cosa llamada entropía y por qué aumenta siempre? <JEs algo que podamos ver, 
tocar o percibir con alguno de nuestros sentidos? A1 acabar su exposición, la 
profesora exclamó: « Si no entienden la segunda ley, no se desanimen. Están en 
buena companía. Por ahora no están capacitados para entenderla, pero lo estarán 
cuando estudien termodinámica estadística el próximo curso». Con este 
comentario final eludía cualquier demanda de aclaración. La atmósfera quedó 
cargada de misterio. Todos permanecimos en silencio, con nuestra ansia de 
comprender insatisfecha. 

Anos más tarde comprobé que la profesora tenía razón al decir que la 
mecánica estadística alberga las claves para comprender la entropía, y que sin 
ella no hay manera de entender lo que hay detrás del concepto de entropía y de 
la segunda ley. Pero en aquel momento todos sospechamos que la profesora 
había optado por una elegante escapatoria de preguntas embarazosas que no 
podía responder, así que aceptamos su consejo sin convencimiento. 

Aquel ano nos ensenaron a calcular los cambios de entropía en numerosos 
procesos, desde la expansión de un gas ideal hasta la mezcla de gases, la 
transferencia de calor de un cuerpo caliente a uno frío, y muchos otros procesos 
espontáneos. Nos ejercitamos en el cálculo de incrementos de entropía, pero de 



hecho nos quedamos sin captar su esencia. Hacíamos los cálculos con destreza 
profesional, tratando la entropía como una magnitud más, pero en lo más hondo 
sentíamos que el concepto quedaba envuelto en un denso aire de misterio. 

iQué es esa cosa llamada entropía? Sabíamos que se definía sobre la base del 
calor transferido (reversiblemente) dividido por la temperatura absoluta, pero no 
era ni una cosa ni otra. ^Por qué aumenta siempre y de qué combustible se sirve 
para propulsarse hacia arriba? Estábamos acostumbrados a las leyes de 
conservación, que se conciben como más « naturales» . La materia y la energía 
no pueden generarse de la nada, pero la entropía parece desafiar el sentido 
común. ^Cómo puede una magnitud física « producir» inexorablemente más de 
sí misma sin ninguna fuente de alimentación aparente? 

Recuerdo haber oído en una de las lecciones de química física que Ia entropía 
de la disolución de argón en agua es grande y negativa^l. La razón ofrecida era 
que el argón incrementa Ia estructura del agua. Un incremento de estructura 
equivalía a un incremento de orden, y la entropía se asociaba vagamente con el 
desorden, así que se suponía que eso explicaba el decremento de entropía. En 
aquella lección, nuestro profesor nos explicó que la entropía de un sistema puede 
disminuir cuando el sistema está acoplado a otro (como un termostato) y que la 
Iey del aumento incesante de la entropía sólo vale para un sistema aislado (que 
no interactúa con su entorno). Este hecho no hacía más que aumentar el misterio. 
No sólo no conocemos la fiiente que alimenta el incremento de entropía, sino que, 
en principio, no hay fuente alguna, ningún mecanismo ni aporte externo. 
Además, ^cómo se ha deslizado la idea de «estructura» u «orden» en la 
discusión de la entropía, un concepto defínido en relación con calor y 
temperatura? 

A1 ano siguiente aprendimos mecánica estadística, así como la relación entre 
la entropía y el número de estados, la famosa fórmula esculpida en la lápida de 
Ludvvig Boltzmann en Viena^. La relación de Boltzmann proporcionaba una 
interpretación de la entropía sobre la base del desorden, y del aumento de la 
entropía como el proceder de la naturaleza del orden al desorden. Ahora bien, 
^por qué debería un sistema pasar del orden al desorden? Éstos son conceptos 
intangibles, mientras que la entropía se definía a partir del calor y la temperatura. 
E1 misterio del incremento perpetuo del desorden no resolvía el misterio de la 
entropía. 

Ensené termodinámica y mecánica estadística durante muchos anos, a lo 
largo de los cuales me di cuenta de que el misterio que envuelve la segunda ley 
no puede disiparse dentro del marco de la termodinámica clásica (o, mejor, la 
formulación no atomista de la segunda ley; véase el capítulo 1). Por otro lado, al 
contemplar la segunda ley desde el punto de vista molecular, comprendí que no 
había misterio alguno. 


Creo que el punto decisivo en mi propia comprensión de la entropía (y, por 
ende, mi capacidad de explicar el concepto a mis alumnos) surgió al escribir un 
artículo sobre la entropía de mezcla y la entropía de asimilación. Sólo entonces 
comprobé que podía ver a través de la neblina que envolvía la entropía y la 
segunda ley. Mientras redactaba el artículo, se me revelaron dos rasgos clave de 
la teoría atómica de la materia que eran cruciales para dispersar las últiinas 
brumas que rodeaban la entropía: los grandes (inimaginablemente grandes) 
números y la indistinguibilidad de las partículas que constituyen la materia. 

Una vez disipada la niebla, todo resultaba claro, incluso obvio. E1 
comportamiento de la entropía, antes tan difícil de comprender, quedaba 
reducido a una cuestión de simple sentido común. 

Es más, de pronto comprendí que no hace falta estudiar mecánica estadística 
para comprender la segunda ley. Lo que descubrí es que todo lo que se necesita 
de la mecánica estadística es la formulación atomística de la entropía. Esta 
constatación fue una motivación poderosa para escribir este libro, que está 
dirigido a los que no saben nada de mecánica estadística. 

Mientras lo escribía, me pregunté más de una vez en qué momento exacto 
decidí que valía la pena hacerlo. Pienso que hubo tres momentos clave. 

E1 primero fue el reconocimiento de los hechos cruciales e indispensables de 
que la materia está constituida por un número gigantesco de partículas y de que 
dichas partículas son mutuamente indistinguibles. Estos hechos han sido bien 
conocidos y reconocidos desde hace al menos un siglo, pero creo que los autores 
que han escrito sobre la segunda ley no los han destacado lo bastante. 

E1 segundo momento fue cuando, al leer los dos libros de Brian Greene^l, 
me tropecé con estas palabras referidas a la entropía y la segunda ley 

Entre las características de la experiencia común que se han resistido a la 
explicación completa está una que se enmarca en los misterios sin resolver más 
profundos de la física moderna. 

No podía creer que un autor como Greene, capazde explicar de manera tan 
brillante y sencilla tantos conceptos difíciles de la física moderna, hubiera escrito 
aquello. 

E1 tercer momento tiene que ver más con la estética que con la sustancia. 
Después de todo, he estado ensenando termodinámica estadística durante muchos 
anos, y a menudo he recurrido a juegos de dados para ilustrar lo que ocurre en 
un proceso espontáneo. Pero la correspondencia entre las caras cambiantes de 
los dados y las partículas que se apresuran a ocupar todo el espacio accesible 
durante un proceso de expansión siempre me pareció lógicamente, y quizás 
estéticamente, insatisfactoria. Como veremos en el capítulo 7, se me ocurrió 
establecer una correspondencia entre dados y partículas, y entre los resultados de 
las tiradas de dados y las localizaciones de las partículas. Esta correspondencia es 


correcta. Siempre podemos atribuir la etiqueta « D» a las partículas situadas en 
el lado derecho y la etiqueta « I» a las situadas en el lado izquierdo. Pero hasta 
que no me puse a escribir el mencionado artícuio sobre las entropías de mezcla y 
de asimilación no «descubrí» un proceso diferente para el que esta 
correspondencia puede hacerse más «natural» y satisfactoria. Es lo que se 
conoce como desasimilación. Se trata de un proceso espontáneo donde el cambio 
de entropía se debe únicamente a que las partículas adquieren una nueva 
identidad. Ahora la correspondencia era entre un dado y una partícula, y entre la 
identidad del resultado de la tirada de un dado y la identidad de la partícula. Esta 
correspondencia me parecía perfecta y más gratificante estéticamente, lo que la 
hacía digna de publicarse. 

En este Iibro he evitado deliberadamente los tecnicismos. En vez de explicar 
lo que es la entropía, cómo varía y, lo más importante, por qué sólo lo hace en un 
sentido, simplemente guiaré a los lectores para que « descubran» la segunda ley 
y obtengan la satisfacción de desvelar por sí mismos el misterio que la rodea. 

La mayor parte del tiempo estaremos jugando, o imaginando que jugamos, a 
Ios dados. Partiremos de un dado, luego dos, diez, cien, mil, etcétera, para ir 
ejercitando la capacidad de analizar Io que ocurre. Averiguaremos qué es eso 
que cambia con el tiempo (o con el número de tiradas) y cómo y por qué 
cambia. Para entonces ya seremos capaces de extrapolar lo aprendido con un 
número pequeno de dados a sistemas constituidos por un número incontable de 
elementos. 

Tras experimentar la expresión de la segunda Iey en el mundo de Ios dados y 
haber comprendido plenamente lo que ocurre, queda un último paso que 
daremos en el capítulo 7. Ahí traduciremos lo aprendido con los dados al mundo 
experimental real. Una vez que los lectores hayan captado la evolución de los 
juegos de dados, estarán en condiciones de entender la segunda ley de la 
termodinámica. 

He escrito este libro pensando en Iectores que no saben nada de ciencia ni 
matemáticas. E1 único prerrequisito para leer este libro es el mero sentido 
común, y Ia voluntad de aphcarlo. 

Una advertencia antes de seguir leyendo: « sentido común» no significa fácil 
o elemental. 

Hay dos « destrezas» que el lector debe adquirir. La primera es aprender a 
pensar números grandes, fantásticamente grandes, inconcebiblemente grandes y 
más allá. Nos aplicaremos a esto en el capítulo 2. La segunda es algo más sutil. 
Tendremos que aprender a distinguir entre un evento (o configuración, o estado) 
especifico y un evento (o configuración, o estado) inespecífico. Aunque suenen 
técnicos, no hay que dejarse intimidar por estos términos^]. Ofreceré ejemplos 
de sobra para familiarizarnos con ellos, porque son indispensables para 
comprender la segunda Iey. Si el Iector tiene dudas de su capacidad para 


entender este libro, le sugiero un test simple. 

A1 final del capítulo 2 encontrará dos cuestionarios pensados para evaluar su 
comprensión de los conceptos « específico» e « inespecífico» . 

Si responde correctamente todas las preguntas, puedo asegurarle que 
entenderá todo el libro sin problemas. 

Si se ve incapaz de contestarlas o da respuestas incorrectas, no se desanime. 
Consulte las respuestas que doy. Si le satisfacen aunque no las haya encontrado 
por sí mismo, creo que está en condiciones de leer y entender el libro, aunque le 
costará un poco más. 

Si desconoce las respuestas y sigue perdido aun después de haberlas 
consultado, eso no significa que el libro esté más allá de su capacidad. Le sugiero 
que lea detenidamente el capítulo 2 y se ejercite en el pensamiento 
probabilístico. Si necesita más, le invito a escribirme y prometo ayudarle en lo 
que pueda. 

Lfna vezmás, no hay que dejarse intimidar por el término « probabilístico» . 
Si al lector no le sorprende que nunca le haya tocado un premio grande de la 
lotería, aunque tenga por costumbre comprar décimos, entonces está pensando 
«probabilísticamente». Para sentirnos más cómodos con esta formidable 
palabra, permítaseme contar una pequena historia. 

Mi padre solía comprar lotería cada fin de semana; lo hizo durante casi 
sesenta anos. Estaba seguro de que alguien « ahí arriba» le favorecería y haría 
que le tocara el premio gordo. Una y otra vez intenté explicarle que sus 
posibilidades de conseguir un premio importante eran reducidas, de hecho menos 
del 0,01 por ciento. Pero él hacía oídos sordos. Si acertaba siete u ocho números 
(de diez) se mofaba de mí por no haber sido capaz de ver los « signos» claros e 
inequívocos que había recibido de Él. Estaba convencido de ir por buen camino. 
Una semana tras otra, sus esperanzas subían y bajaban según su número de 
aciertos o, aún mejor, según los signos que le había mostrado la Providencia. 
Poco antes de morir, a la edad de noventa y seis afios, me dijo que estaba muy 
decepcionado y enfadado porque se sentía traicionado por la deidad en la que 
había creído toda su vida. Me entristeció comprobar que seguía sin querer o 
poder pensar probabilísticamente. 

Quienes nunca hayan oído hablar de la entropía o la segunda ley de la 
termodinámica pueden leer la descripción breve y carente de matemáticas de 
las diversas formulaciones y manifestaciones de la segunda ley en el capítulo 1. 
En el capítulo 2 expongo los elementos básicos de la probabilidad y la teoría de la 
información que el lector podría necesitar para expresar sus hallazgos en 
términos probabilísticos. Quiero subrayar que los fundamentos tanto de la teoría 
de la probabilidad como de la teoría de la información se inspiran sólo en el mero 
sentido común. No hace falta saber nada de matemáticas, física o química. Sólo 
hay que saber contar (matemáticas), saber que la materia está hecha de átomos 



y moléculas (física y química) y que los átomos son indistinguibles (jesto sí es 
física avanzada!). Todo esto se explica en el capítulo 2. En los capítulos 3-5 nos 
dedicaremos a jugar con un número variable de dados. Veremos lo que pasa y 
sacaremos conclusiones. Tendremos numerosas ocasiones de « experimentar» la 
segunda ley con los cinco sentidos, un minúsculo reflejo de la inmensa variedad 
de manifestaciones de la segunda Iey en el mundo físico real. En el capítulo 6 
recapitularemos nuestros hallazgos de forma fácil de traducir al lenguaje de un 
experimento real. E1 capítulo 7 está dedicado a describir dos experimentos 
simples que tienen que ver con el incremento de entropía; todo lo que hay que 
hacer es establecer la correspondencia entre el número de dados y el número de 
partículas en una caja, entre los diferentes resultados de la tirada de un dado y los 
estados de las partículas. Una vez establecida esta correspondencia, es fácil 
aplicar lo aprendido a partir de los juegos de dados para entender la segunda ley 
en el mundo real. 

Después de acabar de leer el capítulo 7, entenderemos lo que es la entropía y 
cómo y por qué se comporta como Io hace. Veremos que no hay ningún misterio 
en su comportamiento: simplemente es de sentido común. 

Tras haber entendido esos dos procesos concretos, veremos con claridad 
cómo funciona la segunda ley. Por supuesto, hay muchos más procesos 
« gobernados» por la segunda ley. Poner de manifíesto su intervención en tales 
procesos no siempre es algo tan shnple y directo. Para ello hay que recurrir a las 
matemáticas. Hay muchos más procesos de gran complejidad donde creemos 
que interviene la segunda ley, pero hasta ahora no tenemos una demostración 
matemática de su papel. Los procesos biológicos son demasiado complejos para 
admitir un análisis molecular sistemático. Aunque soy muy consciente de que 
muchos autores apelan a la segunda Iey en conjunción con diversos aspectos de 
la vida, creo que, en la coyuntura actual, esto es muy prematuro. Estoy 
completamente de acuerdo con Morowitz^ cuando escribió: « E1 empleo de la 
termodinámica en biología tiene una larga historia de confusión» . 

En el último capítulo he incluido algunas reflexiones y especulaciones 
personales. No son opiniones universalmente aceptadas, ni mucho menos, y las 
críticas serán bienvenidas (pongo mi dirección de correo electrónico a 
disposición de los lectores). 

Mi objetivo general al escribir este libro es dar respuesta a dos cuestiones 
asociadas a la segunda ley: qué es la entropía y por qué cambia sólo en un 
sentido (desafiando en apariencia la simetría temporal de las otras leyes de la 
física). 

La segunda cuestión es la más importante, y el meollo del misterio asociado a 
la segunda ley. Espero convencer al lector de que: 

1) La segunda ley es básicamente una ley de probabilidad. 


2) Las leyes de probabilidad son básicamente leyes de sentido 
común. 

3) De (1) y (2) se sigue que la segunda ley es básicamente una ley 
de sentido común, y nada más. 

Por supuesto, admito que las proposiciones (1) y (2) han sido enunciadas 
muchas veces por muchos autores. La primera está implícita en la formulación 
de Boltzmann de Ia segunda ley. La segunda fue expresada por Laplace, uno de 
Ios padres de la teoría de la probabilidad. Desde luego, no puedo pretender que 
soy el primero en enunciarlas. Pero quizá sí pueda reclamar Ia autoría de la idea 
de que Ia relación de « basicalidad» que permite deducir (3) de (1) y (2) es una 
relación transitiva. 

La primera cuestión tiene que ver con el significado de la entropía. Durante 
casi una centuria, los científicos han especulado sobre este asunto. La entropía se 
ha interpretado como una medida del desorden, la confusión, la desorganización, 
el caos, Ia incertidumbre, la ignorancia, la información perdida y cosas por el 
estilo. Hasta donde yo sé, el debate continúa. Incluso en libros recientes, 
científicos importantes expresan opiniones diametralmente opuestas. En el 
capítulo 8 expongo en detalle mi propia postura. Aquí me limitaré a adelantar que 
la entropía puede identificarse, formal y conceptualmente, con una medida 
específica de la información. Se trata de una idea que está lejos de ser 
universalmente aceptada. La esencia de la dificultad para admitir esta identidad 
es que la entropía es una magnitud físicamente medible que tiene unidades de 
energía dividida por temperatura y, por Io tanto, es una magnitud objetiva. La 
información, en cambio, se considera una magnitud adimensional y nebulosa que 
expresa algún atributo humano del estilo del conocimiento, la ignorancia o la 
incertidumbre, lo que la convierte en una magnitud altamente subjetiva^ì. 

Apesar del carácter a primera vista irreconciliable entre una entidad objetiva 
y una entidad subjetiva, sostengo que la entropía es información. Su carácter 
objetivo o subjetivo es una cuestión que se adentra en la filosofía o la metafísica. 
Mi opinión es que ambas magnitudes son objetivas. Pero si uno piensa que una es 
subjetiva, tendrá que admitir que la otra también debe serlo. 

La identidad por la que abogo tiene una contrapartida, y es que hay que 
redefinir la temperatura a partir de la energía. Ello requerirá el sacrificio de la 
constante de Boltzmann, que debería haber sido erradicada del vocabulario de la 
física. Esta supresión reportará unos cuantos beneficios. Para los propósitos de 
este hbro, la ausencia de la constante de Boltzmann convierte la entropía en una 
magnitud adimensional e idéntica a una medida de información. Esto 
« exorcizará» , de una vezpor todas, el misterio de la entropía. 

Me atrevo a prometer lo siguiente: 


1) A los lectores que tengan alguna noción de la entropía y les hay a 
parecido misteriosa, les prometo desmitificarla. 

2) los que nunca hayan oído hablar de la entropía, les prometo 
inmunidad ante cualquier mistificación futura del concepto. 

3) A los lectores que hayan oído hablar de la entropía pero no la 
hayan estudiado, les prometo que si después de haber leído este 
libro oyen a gente hablar del profundo misterio en torno a la 
entropía, deberían sentirse confusos e intrigados, no por la 
entropía ni Ia segunda ley, sino por todo el alboroto sobre el 
«misterio» de la entropía. 

4) Finalmente, quienes lean este libro de manera atenta y aplicada 
y hagan los pequenos deberes repartidos por todo el libro, 
experimentarán el gozo de descubrir y entender algo que 
durante muchos anos ha eludido la comprensión. También 
deberían sentirse profundamente satisfechos de entender « uno 
de los misterios sin resolver más profundos de la física 
moderna» 

Posdata. Aquien se pregunte por el significado de las figuras al final de cada 
capítulo le diré que, ya que asumí la responsabilidad de explicarle la segunda Iey, 
decidí hacer un pequeno seguimiento de su progreso. He colocado estos iconos 
para que el lector compare su estado de comprensión con lo que yo esperaría. Si 
no está de acuerdo, hágamelo saber y le prestaré toda la ayuda que pueda. 


1 

Introducción, y una breve historia de la segunda ley 
de la termodinámica 


En este capítulo presento algunos hitos importantes en la historia de la segunda 
ley de la termodinámica. También presento unas cuantas formulaciones de la 
segunda ley de una manera descriptiva. A1 hacerlo, necesariamente sacrifico la 
precisión. Lo importante aquí no es una discusión formal de la segunda ley, sino 
ofrecer una descripción cualitativa de los tipos de fenómenos que llevaron a los 
científicos decimonónicos a formularla. 

Hay muchas formulaciones de la segunda ley de la termodinámica. Las 
agrupamos en dos clases conceptualmente distintas: no atomistas y atomistas. 


La formulación no atomista de la segunda ley 


[9] 


Tradicionalmente, el nacimiento de la segunda ley se asocia al nombre de 
Sadi Carnot (1796-1832). Aunque no fue el propio Carnot quien formuló la 
segunda ley^^, su obra estableció los cimientos sobre los que Clausius y Kelvin 
edificaron la segunda ley unos anos más tarde. 

Carnot estaba interesado en los motores térmicos, más concretamente en la 
eficiencia de los motores térmicos. Permítaseme describir el más simple de tales 
motores (figura 1.1). Supongamos que tenemos un recipiente de volumen V que 
contiene un fluido, gas o líquido. La parte superior del recipiente está sellada por 
un pistón móvil. Este sistema se denomina motor térmico. 
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Figura 1.1. Motor térmico. 


E1 recipiente está iniciabnente en el estado 1, térmicamente aislado, y está a una 
temperatura Tj digamos 0 °C. En el primer paso del funcionamiento de este 
motor (paso I) colocamos un peso sobre el pistón, con lo que el gas se comprime 
un tanto y el sistema pasa al estado 2. Luego ponemos el recipiente en contacto 
con un reservorio de calor (paso II), que no es más que un cuerpo muy grande a 
temperatura constante, digamos Tj = 100 °C. Se establece así un flujo de energía 
térmica del reservorio de calor al motor. Para simplifícar, suponemos que el 
reservorio de calor es inmenso en comparación con el tamano del motor. En la 
figura 1.1, el reservorio de calor está debajo del motor, aunque en realidad 
debería rodearlo por entero. De esta manera nos aseguramos de que, una vez 
alcanzado el equilibrio, el sistema estará a la misma temperatura que el 
reservorio, T^, y aunque el reservorio haya «perdido» algo de energía, su 
temperatura no cambiará apreciablemente. Amedida que el gas (o líquido) del 
motor se calienta, se expande, y al hacerlo levanta el pistón móvil. En este paso 
el motor hace un trabajo útil: levantar un peso colocado sobre el pistón del nivel 1 
al nivel 2. EI sistema se sitúa ahora en el estado 3. Hasta este punto, el motor ha 
absorbido cierta cantidad de energía en la forma de calor transferido del 
reservorio al gas, lo que le permite realizar un trabajo (en este caso, levantar un 
peso, que a su vezpodría hacer girar las ruedas de un tren, producir electricidad, 
etcétera). Si se retira el peso (paso III) el gas se expande aún más. Llegamos así 
al estado 4 final. 

Si queremos convertir este dispositivo en un motor que realice un trabajo útil 
de manera repetida, como levantar pesos del nivel 1 al nivel 2, tenemos que 
completar un ciclo. Para ello tenemos que devolver el sistema a su estado inicial, 
esto es, enfriar el motor hasta la temperatura Tj inicial (pasoIV). Esto puede 







































lograrse acoplando el recipiente a un reservorio de calor o termostato a 0 °C (de 
nuevo suponemos que el reservorio de calor es mucho mayor que nuestro 
sistema, por lo que su temperatura prácticamente no se ve afectada por el calor 
robado al motor). Una vez enfriado el motor hasta su temperatura inicial Tj, 
habremos vuelto al estado inicial y el ciclo puede volver a comenzar. 

Esto no es exactamente lo que se conoce como ciclo de Carnot, pero tiene 
todos los elementos de un motor térmico que realiza trabajo a base de operar 
entre dos temperaturas, Tj y T^. 

E1 efecto neto de los ciclos repetidos es que el calor, o energía térmica, es 
bombeado al interior del motor desde un cuerpo a temperatura elevada T^ = 100 
°C. Se hace trabajo al levantar un cuerpo, y otra cantidad de energía térmica es 
bombeada del motor a un cuerpo a baja temperatura Tj = 0 °C. E1 auténtico ciclo 
de Carnot es diferente en algunos aspectos, siendo la diferencia más importante 
que todos los procesos se efectúan de manera sumamente lenta y gradualt^]. 
Pero estos detalles no nos incumben aquí. 

Carnotestaba interesado en la eficiencia de un motor térmico en condiciones 
ideales (pistón de masa nula, fricción nula, sin pérdidas de calor, etcétera). 

Cuando se publicó el trabajo de Carnot en 1824 ^], se creía que el calor era 
una suerte de fluido, conocido como calórico. E1 principal interés de Carnot era el 
límite de la eficiencia de los motores térmicos. Lo que encontró es que la 
eficiencia límite depende sólo de la diferencia de temperaturas, y no de la 
sustancia empleada en el motor (el gas o líquido concreto). Más tarde se 
demostró que la eficiencia del motor idealizado de Carnot no podía ser superada 
por ningún motor real. Esto puso la primera piedra de la formulación de la 
segunda ley y preparó el camino para la introducción de un nuevo término: 
« entropía» . 

E1 primero que formuló la segunda ley de la termodinámica fue William 
Thomson (1824-1907), después conocido como Lord Kelvin. Básicamente, la 
formulación de Kelvin establece que no puede haber ningún motor cíclico cuyo 
único efecto sea bombear energía de un reservorio de calor y convertirla 
completamente en trabajo. 

Aunque tal motor no incumpliría la primera ley de la termodinámica (la ley 
de conservación de la energía total), la segunda ley imponía una limitación sobre 
la cantidad de trabajo que puede obtenerse de un motor que opera entre dos 
reservorios de calor a diferente temperatura. 

En pocas palabras, reconociendo que el calor es una forma de energía, la 
segunda ley de la termodinámica establece que es imposible convertir del todo 
calor (energía térmica) en trabajo (aunque lo contrario sí es posible: el trabajo 
puede convertirse del todo en calor, como cuando se agita un fluido mediante un 


agitador magnético o haciendo girar unas palas mecánicamente). Esta 
imposibilidad se expresa a veces como la «imposibilidad del movimiento 
perpetuo de segunda especie» . Si tal « movimiento perpetuo» fuera posible, se 
podría recurrir al enorme reservorio de energía térmica de los océanos para 
impulsar un barco, dejando sólo una estela de agua ligeramente más fría. Por 
desgracia, esto es imposible. 

Otra formulación de la segunda ley de la termodinámica fue ofrecida 
posteriormente por Rudolf Clausius (1822-1888). Básicamente, la formulación de 
Clausius no es más que lo que todos hemos comprobado alguna vez: el calor 
siempre fluye de un cuerpo más cahente (que se enfría en el proceso) a un 
cuerpo más frío (que se calienta). Nunca observamos que el proceso inverso 
tenga lugar de manera espontánea. La formulación de Clausius establece que no 
existe ningún proceso espontáneo cuyo efecto neto sea únicamente la 
transferencia de calor de un cuerpo frío a un cuerpo caliente. Por supuesto, 
podemos conseguir este flujo inverso de calor ejerciendo un trabajo sobre el 
fluido (que es como se consigue la refrigeración). Lo que Clausius afírmó es que 
el proceso de transferencia de calor de un cuerpo caliente a otro frío cuando se 
ponen en contacto, que es un proceso espontáneo, no puede observarse en sentido 
contrario. Esto se muestra esquemáticamente en la figura 1.2, donde dos cuerpos 
inicialmente aislados se ponen en contacto térmico. 

Aunque las formulaciones de Kelvin y de Clausius son distintas, en realidad 
son equivalentes. Esto no es evidente de entrada, pero su equivalencia es fácil de 
demostrar mediante un argumento simple que puede encontrarse en cualquier 
texto elemental de termodinámica. 

Hay muchas otras formulaciones o expresiones de la segunda ley de la 
termodinámica. Por ejemplo, si se deja que un gas confinado en un volumen V 
se expanda, siempre lo hará en una dirección (figura 1.3)f*^. E1 gas se 
expandirá hasta llenar por entero el nuevo volumen, digamos 2V. Nunca veremos 
una inversión espontánea de este proceso, de manera que un gas que ocupe un 
volumen 2V nunca convergerá en un volumen menor, digamos V. 

Hay otros procesos con los que todos estamos familiarizados, que proceden 
en un sentido y nunca en el contrario, como los representados en las figuras 1.2, 
1.3, 1.4 y 1.5. E1 calor fluye de las temperaturas altas a las bajas; los materiales 
fluyen de las concentraciones altas a las bajas; dos gases se mezclan 
espontáneamente, y una gota de tinta que caiga en un vaso de agua se difuminará 
espontáneamente en el líquido hasta que el agua quede homogéneamente tenida 
(figura 1.5). Nunca veremos el proceso inverso. 

Todos estos procesos tienen algo en común, y es que proceden en un sentido, 
y nunca en el contrario de manera espontánea. Pero no estaba ni mucho menos 
claro que todos obedecieran a una misma ley de la naturaleza. Fue Clausius 


quien apreció el principio general común a todos estos procesos. 
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Figura 1.2. 


Figura 1.3. 



Figura 1.4. 


Recordemos que la formulación de Clausius de la segunda ley no es más que un 
enunciado de algo con lo que todos estamos familiarizados. La grandeza del logro 
de Clausius reside en su portentosa intuición de que todos los procesos 
espontáneos descritos están gobernados por una misma ley, y de que hay una 
magnitud que rige el curso de los hechos, una magnitud que, en los procesos 
espontáneos, siempre cambia en el mismo sentido. Esto se Ugó a una flecha o 
vector orientado en un sentido del eje temporal. Fue Clausius quien introdujo el 
término « entropía» , cuya elección justificó asíf ^] : 

Prefiero acudir a las lenguas muertas para los nombres de magnitudes 















científícas importantes, para que tengan el mismo significado en todas las 
lenguas vivas. En consecuencia, propongo llamar a S la entropía de un 
cuerpo, que en griego significa «transformación». He acunado 
deliberadamente la palabra entropía por su similitud con energía, porque 
ambas magnitudes son tan análogas en su significado físico que una 
analogía terminológica me parece útil. 





Figura 1.5. 


En el Me r r ia m - We bste r h Collegiate Dictionary (2003), el vocablo 
« entropía» se define como: « Cambio, giro literario, medida de la energía no 
utilizable en un sistema termodinámico cerrado... medida del grado de orden del 
sistema...» . 

Como discutiremos en el capítulo 8, el término « entropía» en el sentido de 
Clausius es inadecuado. Pero cuando fue acunado, el significado molecular de la 
entropía no se conocía ni entendía. De hecho, como veremos más adelante, la 
entropía no es la « transformación» (ni el « cambio» o « giro» ): es algo que se 
transforma o cambia o evoluciona en el tiempo. 

Con la introducción del nuevo concepto de entropía, ya se podía proclamar la 
formulación general de la segunda ley. En cualquier proceso espontáneo que 
tiene lugar en un sistema aislado, la entropía nunca disminuye. Esta formulación, 
que es muy general y abarca multitud de procesos, sembró la semilla del 
misterio asociado al concepto de entropía, el misterio de una magnitud que no se 
rige por una ley de conservación. 

En física estamos acostumbrados a las leyes de conservación, lo cual tiene 
sentidot^: ni la materia se crea de la nada, ni la energía es gratìs. Tendemos a 
concebir una ley de conservación como algo « comprensible» , algo que « tìene 
sentìdo» . Ahora bien, ^cómo puede una magnitud aumentar indefinidamente, y 
por qué? ^Qué es lo que impulsa esa subida inexorable?No es sorprendente que la 
segunda ley estuviera cubierta por un velo de misterio. De hecho, en el contexto 












de la teoría macroscópica de la materia, la segunda ley de la termodinámica es 
inexplicable. Y podría haber permanecido en el misterio de no ser por el 
descubrimiento de Ia teoría atómica de la materia y su aceptación por parte de la 
comunidad científica. Así, con la formulación macroscópica llegamos a un 
callejón sin salida en nuestra comprensión de la segunda ley de la 
termodinámica. 


La formulación atomista de la segunda ley. 


Antes del desarrollo de la teoría cinética del calor (que se basaba en el 
reconocimiento de la teoría atómica de la materia), la termodinámica se 
aplicaba sin referencia alguna a la composición de la materia, como si ésta fuera 
un continuo. En este contexto la entropía no admitía más interpretación. En sí 
mismo, esto no es inusual. Cualquier ley física acaba en un callejón sin salida que 
debemos aceptar como tal, sin pretender mayor comprensión. Además, la 
segunda Iey se formuló como una ley absoluta: la entropía siempre aumenta en 
cualquier proceso espontáneo en un sistema aislado. Esto no es diferente de 
cualquier otra ley; por ejemplo, Ias leyes de Newton se cumplen siempre, sin 

excepciónt^] 

Un paso de gigante en nuestra comprensión de la entropía y de la segunda ley 
de la termodinámica lo dio Boltzmann con su interpretación estadística de la 
entropía, la famosa relación entre la entropía y el número total de microestados 
de un sistema caracterizado macroscópicamente por una energía, un volumen y 
un número de partículas dados. Ludwig Boltzmann (1844-1906)1-^, junto con 
Maxwell y muchos otros, construyeron lo que hoy se conoce como la teoría 
cinética de gases, o la teoría cinética del calor. Esto no sólo condujo a la 
identificación de la temperatura, que podemos percibir con nuestro sentido del 
tacto, con el movimiento de las partículas que constituyen la materia, sino 
también a la interpretación de la entropía sobre la base del número de estados 
accesibles al sistema. 

Boltzmann introdujo la formulación atomista de la entropía en dos pasos. 
Primero definió una magnitud que denotó como H, y demostró que, como 
resultado de las colisiones moleculares y unos cuantos supuestos, siempre 
disminuye y alcanza un mínimo en el equilibrio. Es lo que Boltzmann llamó 
«teorema del mínimo», más adelante conocido como el teorema H de 
Boltzmann (publicado en 1872). Además, Boltzmann demostró que un sistema de 
partículas con cualquier distribución inicial de velocidades moleculares alcanzará 
el equilibrio térmico. En ese punto, H alcanza su valor mínimo, y la distribución 


de velocidades resultante será necesariamente la llamada distribución de 
Maxwell (véase el capítulo 7). 

En aquella época, la teoría atómica de la materia aún no estaba establecida ni 
contaba con una aceptación universal. Aunque la idea de « átomo» llevaba más 
de dos mil anos rondando en la mente de los cientificos, no había evidencias 
convincentes de su existencia. No obstante, la teoría cinética del calor podía 
explicar la presión y la temperatura de un gas. la entropía, la magnitud 
introducida por Clausius sin ninguna referencia a la composición molecular de la 
materia? 

Boltzmann advirtió que su magnitud H tenía un comportamiento similar al de 
la entropía. Para obtener una magnitud que siempre aumente con el tiempo y 
permanezca constante una vez que el sistema haya alcanzado el equilibrio 
térmico no hay más que redefinir la entropía como el negativo de H. 

E1 teorema H de Boltzmann fue criticado no sólo por científicos como Ernst 
Mach (1838-1916) y Wilhelm Ostwald (1853-1932), quienes no creían en la 
existencia de los átomos, sino también por sus colegas y amigost' 

La esencia de las críticas (lo que se conoce como objeción o paradoja de la 
reversibilidad) es el conflicto aparente entre la simetría temporalt^] de las 
ecuaciones newtonianas del movimiento y la asimetría temporal del 
comportamiento de la H de Boltzmann. Este conflicto entre la reversibilidad del 
movimiento molecular y la irreversibilidad de la magnitud H era profundo e 
irreconciliable. ^Cómo puede derivarse una magnitud que diferencia el pasado 
del futuro (porque siempre aumenta con el paso del tiempo) de unas ecuaciones 
del movimiento que no distinguen en absoluto entre pasado y futuro? Las 
ecuaciones de Newton pueden emplearse para predecir la evolución de las 
partículas tanto hacia atrás como hacia delante en el tiempo. En el teorema H se 
entretejían argumentos tanto mecánicos como probabilísticos. Pero el dominio de 
la mecánica es determinista y simétrico, mientras que el de la probabilidad es 
estocástico y asimétrico. Este conflicto se tomó como un defecto fatal del 
resultado de Boltzmann. Se sospechaba que tenía que haber algún error de 
razonamiento, o incluso que el error estaba en admitir la naturaleza atómica de la 
materia. Esto supuso un revés para el teorema de Boltzmann, y quizás una 
victoria (provisional) para los antiatomistas. 

La réplica de Boltzmann a la objeción de la reversibilidad fue que su teorema 
se cumplía casi siempre, pero que en algunos casos muy raros podía ocurrir que 
H aumentara, o la entropía disminuyera, con el tiempo. 

Esto era insostenible. La segunda ley de la termodinámica, como cualquier 
otra ley de la física, se concebía y proclamaba como absoluta: no cabían las 
excepciones, por infrecuentes que fueran. Nadie había observado nunca una 
violación de la segunda ley. A1 igual que no hay excepciones de las ecuaciones 


newtonianas del movimiento^^, no debería haber excepciones de la segunda 
ley, ni siquiera en casos raros. La segunda ley debe ser absoluta e inviolable. En 
esta fase había dos visiones aparentemente distintas de la segunda ley. Por un 
lado estaba la ley clásica, no atomista y absoluta, formulada por Clausius y 
Kelvin, sintetizada en la aserción de que la entropía nunca disminuye en un 
sistema aislado. Por otro lado estaba la formulación atomista de Boltzmann, que 
afirmaba que la entropía aumenta « casi siempre», pero que hay excepciones, 
aunque son muy raras. Boltzmann proclamaba que la entropía podía disminuir, 
que esto no era imposible, sino sólo improbable^] . Sin embargo, en vista de que 
todas las observaciones aparentemente sustentaban el carácter absoluto de la 
segunda ley, parecía que Boltzmann saldría derrotado, y con él la visión atomista 
de la materia. 

Apesar de las críticas, Boltzmann no cedió, sino que reformuló su concepción 
de la entropía. En vezdel teorema H, que tenía una columna en el campo de la 
mecánica y otra en el de la probabilidad, Boltzmann afianzó firmemente ambas 
columnas en los cimientos de la probabilidad. Ésta era una manera de razonar 
radicahnente nueva y ajena a la física. Por aquel entonces, la probabilidad no 
formaba parte de la fïsica (y ni siquiera de las matemáticas). Boltzmann 
proclamó que la entropía (en su interpretación atomista) es igual al logaritmo del 
número total de configuraciones de un sistema. En esta nueva y osada 
formulación no había rastro de las ecuaciones del movimiento de las partículas. 
Parecía una definición adhoc de una magnitud desprovista de física, una mera 
cuestión de contar el número de posibilidades, el número de estados o el número 
de configuraciones. Ésta entropía atomista entranaba la previsión de excepciones, 
de manera que podía disminuir, si bien con una probabilidad extremadamente 
baja. En aquel momento, el que la formulación de Boltzmann dejara abierta la 
posibilidad de excepciones parecía debilitar su validez en comparación con la 
formulación no atomista, absoluta e inviolable, de la segunda ley. En el capítulo 8 
volveremos sobre este punto y veremos que, de hecho, la posibilidad intrínseca 
de excepciones refuerza más que debilita la formulación atomista. 

Las dos visiones irreconciliables de la segunda ley parecían haber conducido 
a un estado de estancamiento. La formulación de Boltzmann sólo se hnpuso 
después de que la teoría atómica de la materia contara con una aceptación plena. 
Por desgracia para Boltzmann, esto no ocurrió hasta después de su muerte en 
1906. 

Un aiio antes, un artículo teórico decisivo de Einstein sobre el movimiento 
browniano abrió el camino de la victoria para la visión atomista de la materia. A 
primera vista, este asunto no parecía tener nada que ver con la segunda ley. 

E1 movimiento browniano fue descrito por el botánico inglés Robert Brown 
(1773-1858). E1 fenómeno es muy simple: si se observa al microscopio una 



suspensión de partículas diininutas, como granos de polen, en agua, se observa 
que se mueven de manera aparentemente aleatoria. Inicialmente se pensó que 
este movimiento incesante era causado por microorganismos. Pero Brown y 
otros mostraron que el mismo fenómeno se daba con partículas inorgánicas 
dispersas en el líquido. 

Albert Einstein (1879-1955) fue el primero en proponer una teoría del 
movimiento browniano^] Einstein creía en la constitución atómica de la 
materia, y también era un partidario incondicional de Boltzmann^]. Lo que 
Einstein propuso es que, si tenemos un número enorme de átomos o moléculas 
agitándose aleatoriamente en un líquido, es de esperar que haya fluctuaciones. Si 
en el líquido se introducen partículas minúsculas (a escala macroscópica, pero 
todavía grandes en comparación con las dimensiones de las moléculas del 
líquido), estas sufrirán un « bombardeo» molecular aleatorio. De vez en cuando 
se darán asimetrías en este bombardeo de moléculas de líquido sobre las 
partículas suspendidas, y el resultado será un movimiento zigzagueante. 

En 1905, Einstein publicó una teoría de este movimiento aleatorio como parte 
de su tesis doctoral^^. En cuanto su teoría fue corroborada por los 
experimentadores —en particular Jean Perrin (1870-1942)—, la aceptación de la 
visión atomista se hizo inevitable. La termodinámica clásica, basada en la 
naturaleza continua de la materia, no deja lugar a las fluctuaciones. Lo cierto es 
que en un sistema macroscópico las fluctuaciones son extremadamente 
pequenas. Por eso no las observamos a escala macroscópica. Pero a la escala de 
las diminutas partículas brownianas, las fluctuaciones se magnifícan y se hacen 
observables. La aceptación de la constitución atómica de la materia conllevó la 
aceptación de la expresión de Boltzmann de la entropía. Hay que decir que esta 
formulación de la entropía se implantó rápidamente y no quedó afectada ni 
modificada por las dos grandes revoluciones de la física a principios del siglo XX: 
la mecánica cuántica y la relatividad^]. La puerta para la comprensión de la 
entropía estaba ahora abierta de par en par. 

La asociación de la entropía con el número de confíguraciones y sus 
probabilidades era ahora incuestionable desde el punto de vista de la dinámica de 
las partículas. Pero esto no era fácil de comprender y aceptar en una época en la 
que la probabilidad aún no formaba parte de la física. 

Casi al mismo tìempo que Boltzmann publicaba su interpretación de la 
segunda ley, Willard Gibbs (1839-1903) concibió la teoría mecanoestadística de 
la materia, aphcando un enfoque puramente probabihstìco y estadístico. E1 éxito 
aplastante del enfoque de Gibbs, basado en postulados probabilísticos^], nos ha 
dado la seguridad de que un sistema de una enormidad de particulas, aunque en 
última instancia esté gobernado por las leyes del movimiento, se comportará de 
manera aleatoria y caótica, y que prevalecerán las leyes probabilísticas. 


La relación de la entropía con el número de estados de un sistema no basta 
para explicar su comportamiento. Debemos suplementar dicha relación con tres 
hechos y supuestos fundamentales. Primero, que el número de partículas, y aún 
más el de microestados, es enorme. Segundo, que todos estos estados son 
igualmente probables y, por ende, tienen las mismas posibilidades de ser visitados 
por el sistema. Tercero, y principal, que en el equilibrio el número de 
microestados consistentes con (o pertenecientes a) el macroestado observado es 
casi igual al número total de microestados posibles. Volveremos sobre estos 
aspectos de un sistema físico en los capítulos 6 y 7. 

Con estos supuestos suplementarios, que cristalizarían en una teoría firme de 
la termodinámica estadística, la formulación atomista de la entropía obtuvo una 
victoria decisiva. La formulación no atomista de la segunda ley todavía se ensena 
y se aplica con éxito. No hay nada erróneo en ella, salvo que no revela, ni puede 
revelar, el secreto que esconde el concepto de entropía. 

La relación heurística de Boltzmann entre la entropía y el logaritmo del 
número total de estados^7] abrió la puerta al desciframiento del significado de la 
entropía. Pero aún tenemos que dar unos cuantos pasos más para atravesar la 
niebla y disipar el misterio que rodea la entropía. 

Podemos llegar a esta meta a través de varias rutas. Expondré las dos 
principales. Una se basa en la interpretación de la entropía a partir de la extensión 
del desorden en un sistema^^, mientras que la otra tiene que ver con la 
interpretación de la entropía a partir de la información perdida en el sistema^]. 

La primera ruta, la más clásica y popular, parte de la propia interpretación de 
Boltzmann de la entropía: un gran número de estados concebiblemente implica 
gran cantidad de desorden. Esto ha llevado a la lectura corriente de la segunda 
ley de la termodinámica como que «la Naturaleza procede del orden al 
desorden» . 

En mi opinión, aunque esta interpretación de la entropía según el orden- 
desorden resulta intuitivamente clara en muchos casos, no siempre es válida. 
Desde un punto de vista cualitativo, puede decimos qué es lo que cambia en 
algunos procesos espontáneos (aunque no en todos), pero no da respuesta a la 
cuestión de porqué Ia entropía siempre aumenta. 

La segunda ruta, aunque menos popular entre los científicos, es la que 
considero la mejor. En primer lugar, porque la información es una magnitud 
mejor definida, cuantitativa y objetivamente, mientras que el orden y el 
desorden son conceptos no tan bien definidos. En segundo Iugar, la información, o 
más bien la información perdida, puede usarse para dar respuesta a la pregunta 
de qué es lo que cambia en cualquier proceso espontáneo. «Información» es 
una palabra familiar; como los términos « energía» , « fuerza» o «trabajo» , no 
suscita ningún misterio. Su medida se define con precisión en el marco de la 


teoría de la información. Esta magnitud retiene el significado básico de 
información con el que estamos familiarizados. No ocurre así cuando apelamos 
al « desorden» para describir lo que cambia. Discutimos esto en los capítulos 7 y 
8. La información en sí misma no da respuesta a la cuestión de por quê la 
entropía cambia como lo hace. Pero, a diferencia del desorden, se define a partir 
de probabilidades y, como veremos, ahí está la clave de la respuesta que 
buscamos. 

Por las razones expuestas, dedicamos el próximo capítulo a familiarizarnos 
con unas cuantas nociones básicas de probabilidad e información. Lo hacemos de 
manera muy cualitativa, para que todos los lectores, con formación científica o 
sin ella, puedan seguir los argumentos. Todo lo que se requiere es sentido común. 
Tan pronto como nos hayamos familiarizado con estos conceptos, el misterio que 
rodea a la entropía y la segunda ley se desvanecerá, y estaremos en condiciones 
de responder ambas preguntas: qué es lo que cambia y por qué cambia como lo 
hace. 


50 % 



100 % 


Fin del capítulo 1. 



2 

Una breve introducción a la teoría de la 
probabilidad, la teoría de la información, y todo lo 
demás 


La teoría de la probabilidad es una rama de las matemáticas. Tiene usos en 
todos los campos de la ciencia, desde la física y la química hasta la biología y la 
sociología, la economía y la psicología; en resumen, en todos los aspectos de 
nuestras vidas. 

Hacemos « cálculos» probabilísticos de manera consciente o inconsciente en 
muchas de las decisiones que tomamos, sea cruzar la calle, tomar un taxi, comer 
algo que no hemos probado nunca antes, ir a la guerra, negociar un tratado de 
paz, etcétera. En muchas actividades intentamos estimar las posibilidades de éxito 
o fracaso. 

Sin un pensamiento probabilístico de esta índole, un médico no podría 
diagnosticar una enfermedad a partir de los síntomas, ni podría prescribir la 
mejor medicación para la enfermedad diagnosticada. Ni las aseguradoras 
podrían ajustar el coste del seguro de automóvil a la medida de clientes con 
perfiles personales diferentes. 

La teoría de la probabilidad se derivó de las cuestiones que los jugadores 
plantearon a los matemáticos, quienes presumiblemente tenían un mejor 
conocimiento de cómo estimar las posibilidades de ganar en un juego. Puede que 
algunos jugadores incluso creyeran que ciertas personas tenían un don « divino» 
que les permitía predecire 1 resultado de un juego^-L 

Básicamente, la probabilidad es una magnitud subjetiva que mide el grado o 
extensión de la creencia de que ocurrirá cierto suceso^^. Por ejemplo, yo 
puedo estimar que las posibilidades de que un sospechoso haya cometido el 
crimen del que se le acusa son sólo de un 10%, por lo que debería ser absuelto. E1 
juez, en cambio, puede llegar a la conclusión bien diferente de que el sospechoso 
es culpable con una probabilidad elevada. La razón de una discrepancia tan 
extrema es que cada uno tiene su propia información sobre las evidencias y 
evalúa dicha información a su manera. Aunque dos personas tengan la misma 


información, cada una podría procesarla de modo que le condujese a una 
estimación diferente de las posibilidades, o la probabilidad de un suceso (o la 
plausibilidad de cierta proposición). 

De esta noción tan vaga, cualitativa y subjetiva se ha derivado una teoría de 
la probabilidad refinada que es cuantitativa y constituye una rama objetivcÀ^Ì 
de las matemáticas. Aunque no es aplicable a todos los sucesos posibles, se puede 
aplicar a un cuerpo de sucesos muy grande, como es el caso de los juegos de 
azar y muchos « sucesos» que constituyen resultados de experimentos en física. 

Así pues, si uno afirma que la probabilidad de que el Mesías aparezca el 
próximo lunes es del 90%, y otro afirma que no pasa del 1%, no hay manera de 
decidir quién tiene razón. De hecho, aunque esperemos al próximo lunes y 
veamos que no ocurre nada, seguiríamos sin poder decir cuál de las 
probabilidades estimadas era la correcta^-L No obstante, para algunas clases de 
experimentos bien definidos existe una probabilidad « perteneciente» al suceso, 
y que es aceptada por todos. 

Por ejemplo, si lanzamos una moneda de la que no tenemos por qué 
sospechar que está desequilibrada o « trucada» , las posibilidades de los resultados 
« cara» o «cruz» son 50% y 50% respectivamente. En esencia, no puede 
demostrarse que éstas sean las probabilidades « correctas» . Podemos aceptar 
una demostración práctica basada en lanzar muchas veces una moneda y luego 
contar las frecuencias de los resultados. Si lanzamos una moneda mil veces, hay 
muchas posibilidades de que alrededor de 500 veces salga cara y otras 500 veces 
salga cruz. Pero también puede ocurrir que salgan 590 caras y 410 cruces. De 
hecho, podemos obtener cualquier secuencia de cara y cruz. No hay manera de 
derivar o extraer las probabilidades de tales experimentos. En éste y otros 
experimentos similares con monedas o dados, debemos aceptar su existencia 
axiomáticamente. Las posibilidades de 50:50, o mitad y mitad de cara y cruz, 
deben aceptarse como algo perteneciente al suceso, igual que la cantidad de 
masa perteneciente a una porción de materia. Hoy la probabilidad se considera 
un concepto primitivo que no puede definirse a partir de conceptos más 
primitivos. 

Volvamos a la época preprobabilística de los siglos XVI y XVII, cuando el 
concepto de probabilidad sólo había comenzado a emerger. 

Amodo de ejemplo, se dice que a Galileo Galilei (1564-1642) le plantearon 
el siguiente problema: 

Supongamos que jugamos con tres dados y apostamos sobre la suma de los 
resultados de lanzarlos todos juntos. Intuimos con claridad que no sería juicioso 
apostar al 3 o al 18. Nuestra impresión es correcta (en el sentido antes discutido). 
La razón es que tanto el 3 como el 18 sólo pueden darse de una manera: que 
salga 1-1-1 o 6-6-6, respectivamente, e intuitivamente estimamos que ambas 


posibilidades son relativamente raras. Sin duda, es mejor apostar al 7. ^Por qué? 
Porque hay más particiones del número 7 en tres números (entre 1 y 6 ). En otras 
palabras, se puede obtener 7 de cuatro maneras posibles: 1-1-5, 1-2-4, 1-3-3 y 
2-2-3. También intuimos que el número de particiones es mayor cuanto mayor es 
la suma, hasta cierto punto más o menos a medio camino entre el mínimo de 3 y 
el máximo de 18. Ahora bien, ^cómo decidimos si apostar al 9 o al 10? Si 
hacemos cuentas, veremos que ambos resultados tienen el mismo número de 
particiones, es decir, el mismo número de combinaciones de enteros (de 1 a 6 ) 
cuya suma es 9 o 10. Éstas son todas las particiones posibles: 

Para 9: 1-2-6, 1-3-5, 1-4-4, 2-2-5, 2-3-4, 3-3-3. 

Para 10: 1-3-6, 1-4-5, 2-2-6, 2-3-5, 2-4-4, 3-3-4. 

A primera vista, puesto que el 9 y el 10 tienen el mismo número de 
particiones, podríamos concluir que también tienen las mismas posibilidades de 
salir. Pero nos equivocaríamos. En realidad, 10 es mejor apuesta que 9. La razón 
es que, aunque el número de particiones es el mismo en ambos casos, el número 
total de resultados de los tres dados que suman 9 es algo menor que el número de 
resultados que suman 10. En otras palabras, el número de particiones es el 
mismo, pero cada partición tiene un « peso» diferente. Por ejemplo, la partición 
1-4-4 puede darse de tres maneras: 

1-4-4, 4 - 1 - 4 , 4 - 4-1 

Esto se ve fácilmente si usamos tres dados de distintos colores, digamos azul, 
rojo y blanco; entonces las tres posibilidades para 1-4-4 son: 

azul 1, rojo 4, blanco 4 
azul 4, roj o 1, blanco 4 
azul 4, roj o 4, blanco 1 

Cuando contamos todas las particiones posibles con sus pesos respectivos, 
obtenemos los resultados que se muestran a continuación. 

Resultados posibles del lanzamiento de tres dados para suma = 9: 



Pesos : 


1 


1 - 2-6 

1 - 3-5 

1 - 4-4 

2 - 2-5 

2 - 3-4 

1 - 6-2 

1 - 5-3 

4 - 1-4 

2 - 5-2 

2 - 4-3 

2 - 1-6 

3 - 1-5 

4 - 4-1 

5 - 2-2 

3 - 2-4 

2 - 6-1 

3 - 5-1 



3 - 4-2 

6 - 1-2 

5 - 1-3 



4 - 2-3 

6 - 2-1 

5 - 3-1 



4 - 3-2 


6 6 3 3 6 

E1 número total de resultados para 9 es 25. 

Resultados posibles del lanzamiento de tres dados para suma = 10: 


1 - 3-6 

1 - 4-5 

2 - 2-6 

2 - 3-5 

2 - 4-4 

3 - 3-4 

1 - 6-3 

1 - 5-4 

2 - 6-2 

2 - 5-3 

4 - 2-4 

3 - 4-3 

3 - 1-6 

4 - 1-5 

6 - 2-2 

3 - 2-5 

4 - 4-2 

4 - 3-3 

3 - 6-1 

4 - 5-1 


3 - 5-2 



6 - 1-2 

5 - 1-3 


5 - 2-3 



6 - 2-1 

5 - 3-1 


5 - 3-2 




Pesos : 6 6 3 6 3 3 

E1 número total de resultados para 10 es 27. 

Hay 25 resultados distinguibles que suman 9, mientras que hay 27 que suman 
10. Por lo tanto, las posibilidades relativas de 9 y de 10 son 25:27, así que es 
preferible apostar por el 10, como presumiblemente aconsejaría Galileo. 

Pero ^qué significa que 10 es la « mejor» elección, y que éste es el número 
ganador « correcto» ? Es evidente que yo podría apostar por el 10 y el lector por 
el 3, y yo podría perder y el lector ganar. ^Garantizan nuestras cuentas que si 
apostamos por el 10 siempre ganaremos? Obviamente no. i,Qué signifíca, 
entonces, la razón 25:27? 

La teoría de la probabilidad nos da una respuesta. No es una respuesta precisa 
ni plenamente satisfactoria, ni garantiza el triunfo; sólo nos dice que si jugamos 
muchas veces, la probabilidad de que salga 9 es 25/216, mientras que la 
probabilidad de que salga 10 es algo mayor, 27/216 (donde 216 es el número de 
resultados posibles, 6^ = 216). ^Cuántas veces tendremos que jugar para tener la 
seguridad de acertar? Sobre este asunto, la teoría permanece muda. Sólo dice que 
en el límite de un número infinito de lanzamientos, la frecuencia del 9 debería ser 
25/216, y la frecuencia del 10 debería ser 27/216. Pero no podemos lanzar los 
dados infinitamente, así que ^cuál es el sentido de estas probabilidades? Por el 
momento, lo único que podemos decir es que la razón 27:25 refleja nuestra 
creencia o nuestra confianza en que el 10 tiene mayor probabilidad de salir que 



el9[34]. 

Dejemos ahora nuestro juego. Más adelante volveremos sobre éste y otros 
juegos similares con más dados. 

En la discusión anterior hemos empleado la palabra «probabihdad» sin 
definirla. De hecho, ha habido varias propuestas de definición de la probabilidad. 
Cada una tiene sus Iimitaciones. Pero lo más importante es que cada definición 
introduce el concepto de probabilidad en la propia definición, lo que quiere decir 
que todas las definiciones de probabilidad son circulares. La versión actual de la 
teoría matemática de la probabilidad tiene una base axiomática, igual que la 
geometría euclídea o cualquier otra rama de las matemáticas. 

E1 enfoque axiomático es muy simple y no requiere conocimientos 
matemáticos. Fue desarrollado principalmente por Kolmogorov en los anos 
treinta, y consiste en los tres conceptos básicos siguientes: 

1) El espacio muestral. Es el conjunto de todos los resultados 
posibles de un experimento específíco bien definido. Ejemplos: 
el espacio muestral del lanzamiento de un dado consiste en seis 
resultados posibles {1, 2, 3, 4, 5, 6}; el lanzamiento de una 
moneda tiene un espacio muestral consistente en dos resultados 
{cara, cruz}. Estos resultados se denominan sucesos 
elementales. Obviamente, no siempre se puede determinar el 
espacio muestral de un experimento. En algunos casos el 
número de elementos es infinito (como en el lanzamiento de un 
dardo hacia una diana circular) y en otros ni siquiera puede 
describirse. Nos interesan los espacios simples donde los 
resultados, o sucesos elementales, son fáciles de contar. 

2) Una colección de sucesos. Un suceso se define como la unión o 
suma de sucesos elementales. Ejemplos: 

E1 resultado de lanzar un dado es « par» . Este suceso consiste en 
los sucesos elementales {2, 4, 6}, es decir, en si ha salido o saldrá 
2, 4 o 6 en el experimento de lanzar un dado^^. 

E1 resultado de lanzar un dado es « mayor o igual que 5». Este 
suceso consiste en los sucesos elementales {5, 6}, es decir, en si ha 
salido 5 o 6. 

En términos matemáticos, la colección de sucesos consiste en todos los 
subconjuntos del espacio muestral^^. 

3) Probabilidad. A cada suceso le asignamos un número que 
llamaremos la probabilidad de ese suceso, con las siguientes 


propiedades: 


La probabilidad de cada suceso es un número entre cero y uno. 

La probabilidad del suceso seguro (es decir, la ocurrencia de 
cualquier resultado) es uno. 

La probabilidad del suceso imposible es cero. 

Si dos sucesos son disjuntos o mutuamente excluyentes, entonces la 
probabilidad de la suma (o unión) de ambos sucesos no es más que 
la suma de las probabilidades de cada suceso. 

La condición (a) simplemente proporciona la escala de la función de 
probabilidad. En la vida diaria podríamos usar el rango 0-100% para describir las 
posibilidades de, por ejemplo, que llueva manana. En la teoría de la probabilidad 
se emplea el rango (0, 1). La condición (b) simplemente establece que si 
llevamos a cabo un experimento, debe darse alguno de los resultados posibles. A 
este suceso, denominado suceso seguro, se le asigna la probabilidad uno. 
Similarmente, asignamos una probabilidad nula al suceso imposible. La condición 
(d) es intuitivamente autoevidente. La exclusión mutua significa que la 
ocurrencia de un suceso excluye la posibilidad de la ocurrencia del otro. En 
términos matemáticos, decimos que la intersección de ambos sucesos es vacía 
(esto es, no contiene sucesos elementales). 

Por ejemplo, los sucesos: 

A = {el resultado del lanzamiento de un dado es par}. 

B = {el resultado del lanzamiento de un dado es impar } 

son claramente disjuntos, porque la ocurrencia de uno excluye la ocurrencia del 
otro. Si definimos el suceso: 

C= {el resultado del lanzamiento de un dado es mayor o igual que 5} 

es evidente que A y C o B y Cno son disjuntos. A y C contienen el suceso 
elemental 6, mientras que B y Ccontienen el suceso elemental 5. 

Los sucesos «mayor o igual que 4» y «menor o igual que 2» son 
claramente disjuntos. Adelantándonos a la discusión que sigue, podemos calcular 
que la probabilidad del primer suceso {4, 5, 6} es 3/6, y la probabilidad del 
segundo suceso {1, 2} es 2/6, de manera que la probabilidad del suceso 
combinado (o la unión) {1,2,4, 5, 6} es 5/6, que es la suma de 2/6 y 3/6. 

Una manera muy útil de ilustrar el concepto de probabilidad y la regla de la 
suma es el diagrama de Venn. Imaginemos que, con los ojos tapados, lanzamos 
un dardo hacia un tablero rectangular con un área total S= A x B. Supondremos 



que el dardo debe incidir obligatoriamente en algún punto del tablero (fígura 2.1). 
Ahora tracemos un círculo dentro del tablero, y preguntémonos cuál es la 
probabilidad de que el dardo se clave dentro del círculo^], Por puro sentido 
común, suponemos que la probabilidad del suceso « clavarse dentro del círculo» 
es igual a la razón entre el área del círculo y el área total del tablero^], 

Decimos que dos regiones del tablero son disjuntas si no se superponen 
(figura 2.2). Sin duda, la probabilidad de que el dardo se clave en una u otra 
región es la razón entre el área de ambas regiones y el área total del tablero. 

Esto nos lleva directamente a los axiomas de suma antes enunciados. La 
probabilidad de que el dardo se clave en cualquiera de las dos regiones es la 
suma de las probabilidades de cada región. 

Esta ley de aditividad no se cumple cuando las regiones se superponen, es 
decir, cuando hay puntos del tablero que pertenecen a ambas regiones, tal como 
se muestra en la figura 2.3. 



Figura 2.1. 





Figura 2.3. 


En este caso resulta evidente que la probabilidad de que el dardo se clave en 
alguna de las regiones es la suma de las probabilidades correspondientes a cada 
región menos la probabilidad del sector superpuesto. Piénsese simplemente en el 
área cubierta por ambas regiones: es la suma de las áreas respectivas menos el 




área de la intersección. 

E1 edificio entero de la teoría matemática de la probabilidad se erige sobre 
este fundamento axiomático relativamente simple. No sólo es sumamente útil, 
sino también una herramienta esencial en todas las ciencias y más allá. Como el 
lector habrá notado, los principios básicos de la teoría son simples, intuitivos y 
sólo requieren sentido común. 

En la estructura axiomática de la teoría de la probabilidad, se dice que las 
probabilidades se asignan a cada suceso^]. Estas probabilidades deben cumplir 
las cuatro condiciones a, b, c y d. La teoría no define la probabilidad, ni 

proporciona un método para calcularla o mesurarla^O]. De hecho, no hay 
manera de calcular la probabihdad de ningún suceso general. La probabilidad 
sigue siendo una medida de nuestra fe en la ocurrencia de ciertos sucesos, y 
como tal es una magnitud altamente subjetiva. Sin embargo, para algunos 
experimentos simples, como lanzar una moneda o un dado, o encontrar el 
número de átomos en cierta región del espacio, disponemos de métodos de 
cálculo muy útiles. Aunque tienen sus limitaciones y se aplican a casos 
« ideales» , las probabilidades así estimadas resultan sumamente útiles. Y lo que 
es más importante, puesto que se basan en razonamientos de sentido común, 
todos deberíamos convenir en que son las probabilidades « correctas», esto es, 
que dejan de ser subjetivas para considerarse objetivas. Describiremos dos 
« defíniciones» muy útiles que se han sugerido para este concepto. 


La definición clásica. 


Comencemos por la definición clásica, también conocida como la defínición 
a priori^^. Sea N(total) el número total de resultados posibles de un experimento 
concreto. Por ejemplo, para el lanzamiento de un dado, N(total) es seis (los seis 
resultados, o sucesos elementales, de este experimento). Denotamos por 
N(suceso) el número de resultados (sucesos elementales) incluidos en el suceso 
que nos interesa. Por ejemplo, el número de sucesos elementales incluidos en el 
suceso « par» es 3, esto es, {2, 4, 6}. La probabilidad del suceso que nos interesa 
se define como la razón N(suceso)/N(total). Ya hemos hecho uso de esta 
definición intuitivamente satìsfactoria al calcular la probabilidad del suceso 
« mayor o igual que 4» . E1 número total de sucesos elementales (resultados) del 
lanzamiento de un dado es N(total) = 6. E1 número de sucesos elementales 
incluidos en el suceso « mayor o igual que 4» es N(suceso) = 3. Por lo tanto, la 
probabilidad del suceso considerado es 3/6, o 1/2, que para todos es la estimación 


« correcta» . 

Sin embargo, al aplicar esta definición de probabilidad hay que actuar con 
cautela. Para empezar, no todo suceso puede « descomponerse» en sucesos 
elementales (como es el caso del suceso « manana comenzará a llover a las diez 
en punto»). Pero lo más importante es que la fórmula anterior presume que 
todos los sucesos elementales tienen las mismas posibilidades de ocurrir. En otras 
palabras, se presume que cada suceso elemental tiene la misma probabilidad (1/6 
en el caso del dado). Pero ^cómo podemos asegurarlo? Hemos ofrecido una 
fórmula para calcular la probabilidad de un suceso que se basa en el 
conocimiento de las probabilidades de los sucesos elementales. Por eso esta 
definición clásica no puede tomarse como una verdadera definición de 
probabilidad, ya que es circular. Aun así, se trata de una « definición» (o, mejor, 
un método de cálculo) sumamente útil. Se basa en nuestra creencia en que cada 
suceso elemental tiene la misma probabilidad, en este caso 1/6. ^Por qué 
creemos tal cosa? Lo mejor que podemos hacer es invocar el argumento de la 
simetría. Puesto que presumimos que todas las caras del dado son equivalentes, 
sus probabilidades deben ser iguales. Esta conclusión tendría que ser 
universalmente aceptada, tanto como la aserción axiomática de que dos líneas 
rectas se cruzarán como mucho en un único punto. Así, mientras que la 
probabilidad del suceso «lloverá manana» es altamente subjetiva, que la 
probabilidad del suceso « par» al arrojar un dado es 1/2 es algo en lo que todo el 
mundo que pretenda razonar probabilísticamente debería estar de acuerdo, igual 
que cualquiera que pretenda razonar geométricamente debe aceptar los axiomas 
de la geometría. 

Como en la geometría, todos los resultados y teoremas derivados de los 
axiomas se aplican estrictamente a casos ideales: un dado « equitativo» o una 
moneda « equitativa» . No se define lo que es un dado equitativo. Es un concepto 
tan « ideal» como un círculo o cubo platónico^]. Todos los dados reales, como 
todos los cubos o esferas reales, son sólo réplicas aproximadas de los objetos 
platónicos ideales. En la práctica, si no tenemos ningún motivo para sospechar 
que un dado no es totalmente homogéneo o simétrico, podemos suponer que es 
ideal. 

Esta limitación no impide que el procedimiento de cálculo de probabilidades 
descrito sea muy útil en muchas aplicaciones. Uno de los postulados básicos de la 
mecánica estadístìca es que cada uno de los microestados que comprende un 
sistema macroscópico tìene la misma probabilidad. Una vezmás, este postulado 
no es más «demostrable» que la aflrmación de que cada resultado del 
lanzamiento de un dado es igualmente probable. Esto nos lleva a la segunda 
«definición» o, si se prefiere, el segundo procedimiento de cálculo de 
probabilidades. 


La definición de frecuencia relativa. 


Veamos ahora la llamada definición a posteriori o « experimental» , ya que 
se basa en el cómputo de Ia frecuencia relativa de la ocurrencia de un suceso. E1 
ejemplo más simple es el juego de cara o cruz. Hay dos resultados posibles: cara 
o cruz. Excluimos posibilidades raras, como que la moneda caiga de canto, o se 
haga anicos durante el experimento, o desaparezca de la vista. 

Procedemos a lanzar una moneda Nve ces, y registramos la frecuencia con 
la que sale cara. Éste es un experimento bien definido y factible. Si n(H) es el 
número de caras en N(total) lanzamientos, entonces la frecuencia del suceso 
« cara» es n(H)/N(total). La probabilidad de ocurrencia del suceso « cara» se 
define como el límite de dicha frecuencia cuando N tiende a infinito^]. Por 
supuesto, esta definición no es nada práctica. Para empezar, no podemos lanzar 
la moneda infinitas veces. Y aunque pudiéramos, ^quién nos garantiza que ese 
límite existe? Sólo podemos imaginarlo. Creemos que el mencionado límite existe 
y que es único, pero lo cierto es que no podemos demostrarlo. 

En la práctica, la definición anterior se aplica tomando valores de N muy 
grandes. iPor qué? Porque creemos que si N e s Io bastante grande y la moneda 
no está trucada, entonces hay una elevada probabilidad de que la frecuencia 

relativa de « cara» sea 1/2^4] Una vez más, hemos introducido el concepto de 
probabilidad en su propia definición. 

Este método puede emplearse para « demostrar» que la probabilidad de cada 
resultado posible del lanzamiento de un dado es 1/6. Sólo hay que repetir el 
experimento muchas veces y contar las veces que ha salido 4 (o cualquier otro 
resultado). La frecuencia relativa puede servir para « demostrar» la probabilidad 
de ese suceso. Este razonamiento descansa sobre la creencia de que si N e s lo 
bastante grande, deberíamos obtener la frecuencia de uno de los seis resultados 
posibles. Ahora bien, £y si hacemos el experimento un millón de veces y 
hallamos que la frecuencia relativa de «4» es 0,1665 (en vez de 0,1666...)? 
iQué conclusión podríamos sacar? Una podría ser que el dado es «justo» , pero 
que hacían falta más lanzamientos. Otra conclusión podría ser que el dado está 
sesgado y pesa un poco más de un lado que de otro. La tercera conclusión podría 
ser que los lanzamientos no eran perfectamente aleatorios. ^Cómo estimamos la 
probabilidad de un suceso, entonces? Lo único que podemos hacer es apelar a 
nuestro sentido común. Recurrimos al sentido común para juzgar que, en virtud 
de la simetría del dado (todas las caras son equivalentes), la probabilidad de cada 
resultado debe ser la misma. No hay manera de demostrar esto. Todo lo que 


podemos decir es que, si el dado es ideal (un dado así no existe en la práctica), 
entonces creemos que, si lanzamos el dado muchas veces, a largo plazo el 
resultado «4» sale en una sexta parte del número total de lanzamientos. Esta 
creencia, aunque parezea subjetiva, debe ser compartida por todos nosotros y 
contemplada como objetiva. Uno tiene derecho a no aceptar esta convención, por 
supuesto, pero si no lo hace no podrá hacer uso de la teoría de la probabilidad ni 
encontrar convincentes los argumentos presentados en el resto de este libro. 

Hay que decir, no obstante, que la identificación de los sucesos elementales 
no siempre es sencilla o posible. Veamos un conocido ejemplo. Supongamos que 
tenemos Vpartículas (electrones, por ejemplo) y Mcasillas (niveles de energía). 
Hay diferentes maneras de distribuir las N partículas en las M casillas. Si no 
tenemos más información, podemos suponer que todas las configuraciones son 
equiprobables. La figura 2.4 muestra todas las configuraciones posibles para N = 
2 partículas en M = 4 casillas. 

Podemos asignar la misma probabilidad a cada una de las 16 
configuraciones. Esta asignación se conoce como «estadística clásica» (no 
confundir con la definición « clásica» de probabilidad). Valdría para monedas o 
dados repartidos en casillas, pero no para partículas moleculares distribuidas en 
niveles de energía. 

Resulta que la naturaleza impone ciertas restricciones sobre las 
configuraciones que cuentan como sucesos elementales. La naturaleza también 
nos dice que hay dos maneras de contabilizar sucesos elementales, según el tipo 
de partícula. Para las partículas llamadas bosones (como los fotones o los átomos 
de He4) sólo hay diez configuraciones equiprobables, tal como se muestra en la 
figura 2.5. 

Para el segundo grupo de partículas (como los electrones o los protones), 
conocidas como fermiones, sólo hay seis configuraciones posibles, tal como se 
muestra en la fígura 2.6. 

En el primer caso (figura 2.5) decimos que las partículas obedecen a la 
estadística de Bose-Einstein, y en el segundo caso (figura 2.6) decimos que 
obedecen a la estadística de Fermi-Dirac. Pongo este ejemplo sólo para mostrar 
que no tenemos una regla universal para enumerar los sucesos elementales. 
















































































































































Figura 2.5. Confíguraciones de Bose-Einstein. 







Figura 2.6. Confíguraciones de Fermi-Dirac. 


Sólo podemos proceder por ensayo y error para seleccionar los sucesos 
elementales, y luego buscar algún respaldo teórico para la selección correcta 
final. De este modo se han descubierto principios físicos de gran calado^]. 


Sucesos independientes y probabilidad condicionada. 


Los conceptos de dependencia entre sucesos y probabilidad condicionada 
están en el núcleo de la teoría de la probabilidad y tienen multitud de usos en 
cienciat^]. En este libro sólo necesitamos el concepto de independencia entre 
dos sucesos. Pero el razonamiento basado en la probabilidad condicionada 
aparece en numerosas aplicaciones del cálculo de probabilidades. 

Se dice que dos sucesos son independientes si la ocurrencia de uno no afecta a 
la probabilidad del otro. 

Por ejemplo, si dos personas alejadas una de otra lanzan un dado cada una, 
los resultados de las dos tiradas son independientes, en el sentido de que el hecho 
de que salga, digamos, un 5 en un dado no influye en absoluto en la probabilidad 
de que salga un 3 en el otro (el par de dados de la izquierda en la figura 2.7). Por 


























otro lado, si ambos dados están conectados mediante un alambre inflexible (el 
par de la derecha en la figura 2.7), los resultados de cada uno serán mutuamente 
dependientes. Intuitivamente se ve que, siempre que tenemos dos sucesos 
independientes, la probabilidad de que ocurran ambos (digamos un 5 en un dado 
y un 3 en el otro) es el producto de las probabilidades respectivas. La razón es 
muy simple. A1 lanzar dos dados simultáneamente, tenemos 36 sucesos 
elementales posibles. Cada uno de estos resultados tiene una probabilidad de 1/36, 
que también es 1/6 x 1/6, esto es, el producto de las probabilidades de cada suceso 
elemental de uno y otro dado. Un segundo concepto fundamental es el de 
probabilidad condicionada, que se define como la probabilidad de que ocurra un 
suceso A sabiendo que ha ocurrido el suceso B. 





Figura 2.7. 


La denotamos como Pr {A/B} (que se lee: probabilidad de A dado 5)^7] 

Es evidente que si ambos sucesos son independientes, entonces la ocurrencia 
de B no afecta a la probabilidad de A. Lo denotamos como Pr { A/B} = Pr {A}. 
Lo interesante es cuando hay dependencia, es decir, cuando la ocurrencia de un 
suceso sí afecta a la probabilidad de que ocurra otro. En la vida diaria hacemos 
estimaciones de probabilidades condicionadas a menudo. 

Aveces la ocurrencia de un suceso incrementa la probabilidad del segundo, y 
otras veces la disminuye. Ejemplos: 

1) La probabilidad de que llueva hoy por la tarde sabiendo que al 
mediodía el cielo está muy nublado es mayor que la 
probabilidad de « esta tarde llueve» . 

2) La probabilidad de que llueva hoy por la tarde sabiendo que al 
mediodía el cielo está despejado es menor que la probabilidad 
de « esta tarde llueve» . 

3) La probabilidad de que llueva hoy sabiendo que el resultado del 
lanzamiento de un dado ha sido «4» es la misma que la 
probabilidad de « hoy llueve» . 






Podemos decir que, en el primer ejemplo, los dos sucesos están 
correlacionados positìvamente, mientras que en el segundo ejemplo lo están 
negativamente, y en el tercer ejemplo no lo están en absoluto^] 

En los tres ejemplos que acabamos de ver apreciamos que los enunciados son 
correctos. Pero no podemos cuantìficarlos. En este caso, cada cual tendría su 
propia estimación de la probabilidad de « esta tarde llueve» . 

Para hacer las cosas más cuantitatìvas y objetivas, consideremos los 
siguientes sucesos: 

A = {E1 resultado del larrzamiento de un dado es « 4» }. 

B = {E1 resultado del lanzamiento de un dado es « par» } (es decir, 2, 4 o 6) 

C= {E1 resultado del lanzamiento de un dado es « impar» } (es decir, 1, 3 o 

5) 


Podemos calcular las dos probabilidades condicionadas siguientes: 

Pr {A/B} = 1/3 > Pr {A} = 1/6. 

Pr {A/C} = 0 < Pr {A} = 1/6. 

En el primer caso, el conocimiento de que B ha tenido lugar incrementa la 
probabilidad de A. Sin ese conocimiento la probabilidad de A es 1/6 (una de seis 
posibihdades). Dado B, la probabilidad de A se eleva a 1/3 (una de tres 
posibilidades). En cambio, si sabemos que ha ocurrido C, la probabilidad de A cae 
a cero y, por ende, es menor que la probabilidad de A sin dicho conocimiento. 

Es importante distinguir entre sucesos disjuntos (es decir, mutuamente 
excluyentes) y sucesos independientes. Dos sucesos son disjuntos cuando la 
ocurrencia de uno excluye la ocurrencia del otro. Ser disjuntos es una propiedad 
de los propios sucesos (no hay ningún suceso elemental común a ambos sucesos). 
La independencia entre sucesos, en cambio, no se define por sus sucesos 
elementales, sino por probabilidades. Dos sucesos disjuntos son altamente 
dependientes. E1 ejemplo que sigue ilustra la relación entre dependencia y 
superposición. 

Consideremos el caso de una ruleta con doce números {1, 2, 3, 4, 5, 6, 7, 8, 9, 
10, 11, 12}. Cada uno de nosotros elige una secuencia de seis números. 
Pongamos que yo elijo la secuencia: 


A= {1,2,3, 4, 5, 6} 


Y el lector elige la secuencia: 


B = {7, 8, 9, 10, 11, 12} 

La bola rueda en círculo. Damos por sentado que la ruleta es «justa», es 
decir, que cada resultado tiene la misma probabilidad de 1/12. Si la bola cae en 
mi territorio, esto es, si va a parar a cualquiera de los números {1, 2, 3, 4, 5, 6} 
por mí elegidos, gano yo. Si la bola cae en el territorio del lector, esto es, si va a 
parar a cualquiera de los números (7, 8, 9, 10, 11, 12}, gana él. 

Por supuesto, cada uno de nosotros tiene la misma probabilidad, 1/2, de ganar. 
La bola tiene la misma probabilidad, 1/12, de pararse en cualquier número, y 
cada uno de nosotros tiene seis posibilidades en su territorio, así que los dos 
tenemos las mismas posibilidades de ganar. 

Ahora supongamos que jugamos y al lector le notifican que he ganado yo. 
^Cuál es la probabilidad de que gane si escogió B? Obviamente, Pr {B/A} = 0 < 
1/2, es decir, la probabilidad condicionada de B dado A es cero, que es menor que 
la probabilidad no condicionada Pr {5} = 1/2. A modo de ejercicio simple, 
propongo que el lector intente calcular unas cuantas probabilidades 
condicionadas. En cada ejemplo, mi elección de la secuencia A = { 1, ..., 6} es 
fij a. E1 lector debe calcular las probabilidades condicionadas de las siguientes 
elecciones diferentes de su secuencia. (Nótese que, en este juego, ambos 
jugadores pueden ganar). 

Pr {7, 8, 9, 10, 11, 12A4},Pr {6, 7, 8, 9, 10, 11/4}, 

Pr {5, 6, 7, 8, 9, 10/4}, Pr {4, 5, 6, 7, 8, 9/4}, 

Pr {3, 4, 5, 6, 7, 8/4}, Pr {2, 3,4, 5, 6, 7/4}, 

Pr {1,2, 3, 4, 5,6/4}. 




Figura 2.8. 


Cabe advertir que las correlaciones pasan de la negatividad extrema (en el 
primer ejemplo, la ocurrencia de A excluye la victoria del lector) a la positividad 
extrema (en el último ejemplo, la ocurrencia de Aasegura la victoria del lector). 
En algún punto intermedio, tiene que haber una elección de secuencia que sea 
indiferente a la información « dado A» . ^Cuál es esa elección? Si el lector es 
capaz de calcular las probabilidades condicionadas anteriores, entonces es que 
entiende la diferencia entre sucesos disjuntos y sucesos independientes. Si no es 
capaz de hacerlo, puede consultar las soluciones al final de este capítulo (página 
88). Es un bonito ejercicio, aunque no es esencial para comprender la segunda 












ley. 


Tres advertencias. 


Probabilidad condicionada y probabilidad subjetiva. 

Hay una tendencia a decir que la « probabilidad» es objetiva, mientras que la 
probabilidad condicionada es subjetiva. Para empezar, téngase en cuenta que 
toda probabilidad es condicionada. Cuando decimos que la probabilidad de que 
salga un 4 al lanzar un dado es 1/6, en realidad nos referimos a la probabilidad 
condicionada del resultado « 4», sabiendo que se ha dado o se dará uno de los 
resultados posibles 1, 2, 3, 4, 5, 6, que el dado es insesgado, que lo lanzamos al 
azar y cualquier otra información relevante. En nuestra notación solemos 
suprimir esta información dada y hablamos de probabilidad no condicionada, la 
cual se considera una probabilidad objetiva^] 

Ahora consideremos los dos pares de ejemplos detallados a continuación: 

0\: La probabilidad condicionada de « 4» , sabiendo que Jacob conoce que 
el resultado ha sido « par» , es 1/3. 

C>2 : La probabilidad condicionada de « 4» , sabiendo que Abraham conoce 
que el resultado ha sido « impar» , es cero. 

S La probabilidad condicionada de que el acusado sea « culpable» , dado 
que la policía lo vio en la escena del crimen, es 9/10. 

Sx- La probabilidad condicionada de que el acusado sea « culpable» , dado 
que fue visto por al menos cinco personas en otra ciudad a la hora del 
crimen, es casi nula. 

En todos los ejemplos anteriores hay una tendencia a referirse a la 
probabilidad condicionada como una probabilidad subjetìva. La razón es que 
hemos introducido un conocimiento personal de las condiciones que juzgamos 
subjetìvo. Pero no es así. Las probabilidades 0\ y O^ son probabilidades 
objetìvas. 

E1 hecho de que mencionemos los nombres de las personas conocedoras de 
las condiciones no hace que la probabilidad condicionada sea subjetìva. En 0\ 
podríamos cambiar Jacob por Raquel. La probabilidad de « 4» condicionada a 
que Raquel sabe que el resultado es par sigue siendo 1/3. La subjetìvidad de este 
enunciado es una ilusión derivada de la inclusión del nombre de la persona que 
« conoce» la condición. Una versión mejorada de 0\ es: la probabilidad del 


resultado « 4», condicionada a que sabemos que el resultado es par, es 1/3. O 
mejor todavía: la probabilidad del resultado « 4» , condicionada a que el resultado 
es « par» , es 1/3. 

En los dos últimos enunciados queda claro que la identidad del conocedor de 
la condición, sea Jacob, Raquel o cualquiera de nosotros, no tiene ninguna 
influencia sobre la probabilidad condicionada. En la última versión hemos hecho 
que la condición sea del todo impersonal. Así pues, podemos concluir que la 
condición dada no convierte por sí sola una probabilidad objetiva (no 
condicionada) en una probabilidad subjetiva. 

Considérese el siguiente párrafo de Callen (1983): 

E1 concepto de probabilidad tiene dos interpretaciones distintas en el uso 
corriente. La « probabilidad objetiva» se refiere a una frecuencia, o una 
ocurrencia fraccionaria; la afirmación de que « la probabilidad de que un 
recién nacido sea varón es algo menor que una mitad» es un enunciado 
sobre datos censales. La « probabilidad subjetiva» es una medida de una 
expectativa basada en una información subóptima. La evaluación por un 
médico de la probabilidad (subjetiva) de que una criatura aún no nacida 
sea varón depende del conocimiento que tiene el médico de las historias 
familiares de los progenitores, de los datos acumulados sobre niveles 
hormonales maternos, de la claridad creciente de las imágenes por 
ultrasonidos y, finalmente, de una estimación bien informada, pero que 
sigue siendo subjetiva. 

Aunque no lo dice explícitamente, lo que el autor quiere significar es que el 
primer ejemplo, «la probabilidad de que un recién nacido sea varón es algo 
menor que una mitad», es una respuesta a una cuestión de probabilidad no 
condicionada, « ^cuál es la probabilidad de que un recién nacido sea varón?», 
mientras que el segundo ejemplo es una respuesta a una cuestión de probabilidad 
condicionada, « ^cuál es la probabilidad de que un bebé concreto aún no nacido 
sea varón?, dada... toda la información que se indica» . 

No hay duda de que la respuesta a la segunda pregunta es altamente 
subjetiva. Diferentes médicos darán respuestas diferentes a la misma pregunta. 
Pero lo mismo vale para la primera pregunta, dada una información diferente. 
Lo que hace que la segunda pregunta y su respuesta sean subjetivas no es la 
condición, el conocimiento específico de este o aquel médico, sino la 
insuficiencia del conocimiento. Un conocimiento insuficiente confiere libertad 
para dar cualquier respuesta (subjetiva) a la segunda pregunta. Ahora bien, 
ocurre igual con la primera pregunta. Si todas las personas preguntadas tienen el 
mismo conocimiento, o la misma falta de información, son libres de dar 



cualquier respuesta. La primera pregunta no se refiere « a datos censales», 
como dice la cita, sino a la probabïlidad de que un recién nacido sea varón, dada 
una información sobre « datos censales» . Si no tenemos ninguna información no 
podemos responder esta «cuestión objetiva», pero cualquiera que tenga la 
misma información sobre los datos del censo dará necesariamente la misma 
respuesta objetiva. 

Todo el mundo parece estar de acuerdo en que hay dos tipos de probabilidad 
esencialmente distintos. Uno sería la probabilidad opinable, altamente subjetiva, 
y el segundo sería la probabilidad física o científica, considerada objetiva. 
Ambas pueden ser condicionadas o no condicionadas. En este libro sólo 
manejaremos probabilidades científicas y, por ende, objetivas. En todos los usos 
científicos de la probabilidad damos por hecho que las probabilidades vienen 
dadas de manera explícita o hnplícita por una receta de cálculo dada. Pueden ser 
más o menos fáciles de calcular^], pero siempre puede suponerse que « están 
ahí» en el suceso, como Ia masa asociada a un pedazo de materia. 

Probabilidad condicionada y causa-efecto. 

La « condición» en Ia probabilidad condicionada de un suceso puede ser la 
causa del mismo, o puede no serlo. Considérense los dos ejemplos siguientes: 

1) La probabilidad de que un paciente muera de cáncer de pulmón, 
condicionada a que es un fumador empedernido, es de 9/10. 

2) La probabilidad de que un paciente sea un fumador 
empedernido, condicionada a que tiene cáncer de pulmón, es de 
9/10. 

Es evidente que la información incluida en la primera condición es la causa 
(o una causa altamente probable) de la ocurrencia del cáncer de pulmón. En el 
segundo ejemplo, en cambio, la información incluida en la condición de que el 
paciente tiene cáncer de pulmón no puede ser la causa de que sea un fumador 
empedernido. E1 paciente podría haber comenzado a fumar a los veinte anos, 
mucho antes de la aparición del cáncer. 

Aunque los dos ejemplos anteriores son claros, a veces la condición se 
confunde con la causación. Así como percibimos que las causas anteceden al 
efecto, tendemos a pensar que la condición antecede al suceso en la probabilidad 
condicionada. 

Veamos un ejemplo ilustrativo simple que ha sido estudiado con gran detalle 
por Ruma Falk( 1979)^1. Se puede tomar como un ejercicio sencillo de cálculo 
de probabilidades condicionadas. Pero creo que este ejemplo da para más, 
porque nos hace ver cómo asociamos intuitivamente la probabilidad 
condicionada con la flecha del tiempo, confundiendo la causalidad con el 


razonamiento probabilístico. Esto puede o no ser relevante para la asociación 
entre el sentido del cambio entrópico y la flecha del tiempo (que discutiremos en 
el capítulo 8). 

E1 problema es muy simple. Una urna contiene cuatro bolas, dos blancas y 
dos negras; las bolas están bien mezcladas y sacamos una con los ojos tapados. 

Primero nos preguntamos cuál es la probabilidad del suceso « bola blanca en 
la primera extracción» . La respuesta es inmediata; 1/2. Hay cuatro resultados 
posibles, dos de los cuales son compatibles con el suceso « bola blanca» , así que 
la probabilidad es 2/4 = 1/2. 

Luego nos preguntamos cuál es la probabilidad condicionada de sacar una 
bola blanca en una segunda extracción, sabiendo que en la primera extracción 
hemos sacado una bola blanca (que no ha sido devuelta a la urna). Denotamos 
dicha probabilidad como Pr {blanca^/blanca^}. E1 cálculo es muy simple. 
Sabemos que la primera vez se extrajo una bola blanca que no se ha devuelto. 
Tras la primera extracción quedan tres bolas, dos negras y una blanca, así que 
ahora la probabilidad de extraer una bola blanca es simplemente 1/3. 

Esto es bastante obvio. Escribimos: 

Pr { blanca^jblanca\} = 1/3 

Ahora otra pregunta más difícil: ^cuál es la probabilidad de que hayamos 
sacado una bola blanca en la primera extracción, sabiendo que la segunda bola es 
blanca? Simbólicamente, lo que buscamos es. 

Pr {blanca\/blanca 2 } = ? 

Es una pregunta desconcertante. ^Cómo puede un suceso del « presente» 
(bola blanca en la segunda extracción) afectar a la probabilidad de un suceso del 
« pasado» (bola blanca en la primera extracción)? 

Ambos problemas se plantearon en un aula, y los estudiantes no tuvieron 
difícultades para calcular Pr {blancaýblancai} , razonando que la extracción de 
una bola blanca en primera instancia había causado un cambio en la urna y, por 
ende, había afectado a la probabilidad de volver a extraer una bola blanca. 

Sin embargo, pedirles que hallaran Pr {blanca\/blanca 2 } causó bastante 
revuelo. Algunos adujeron que la pregunta no tenía sentido, porque los sucesos 
del presente no pueden afectar a la probabilidad de un hecho del pasado. Otros 
respondieron que, puesto que lo acontecido en el presente no puede afectar al 
pasado, la probabilidad tenía que ser 1/2. Se equivocaban, porque la respuesta es 
1/3. Un tratamiento más completo de este problema puede encontrarse en Falk 
(1979). Aquí quiero llamar la atención del lector sobre el hecho de que a veces 



nos equivocamos al asociar la probabilidad condicionada con la causalidad, 
debido a que intuitìvamente tendemos a colocar la condición antes del efecto; de 
ahí la asociación de la probabïlidad condicionada con la flecha del Tiempo. 

La distinción entre causación y probabilidad condicionada es importante. 
Quizá deberíamos mencionar una característìca de la causalidad no compartida 
por la probabilidad condicionada. Se trata de la transitividad. La causalidad es 
transitiva, lo que signifíca que si A causa B y B causa C, entonces A causa C. Un 
ejemplo simple: si fumar es causa de cáncer, y el cáncer es causa de muerte, 
entonces fumar es causa de muerte. 

La probabilidad condicionada no tiene por qué ser transitiva. Ya hemos 
distinguido entre correlación positìva y correlación negativa. Si A favorece 5, 
esto es, la probabilidad de B dado A es mayor que la probabilidad de B (Pr {B/Aj 
> Pr {B}), y B favorece C (esto es, Pr { C/B } > Pr {C}), de esto no 
necesariamente se sigue que A favorece C. 

Veamos un ejemplo de probabilidad condicionada no transitiva. Considérense 
los siguientes tres sucesos en el lanzamiento de un dado: 


A= {1,2, 3,4 },B= {2, 3,4, 5}, C= {3,4, 5,6} 


Es indudable que A favorece B (Pr {B/A} = 3/4 > Pr {5} = 2/3) y que B 
favorece C(Pr {C/B} = 3/4 > Pr {Q = 2/3), pero Ano favorece C (Pr {C/A} = 
1/2 <Pr {Q = 2/3). 

Probabïlidad condicionada y probabilidad conjunta. 

La advertencia que sigue puede beneficiar a quienes nunca hayan estudiado 
probabilidad. 

Tenía un amigo que solía ir en moto. Una noche en que circulaba por una 
autopista fue arrollado por un camión y resultó gravemente herido. Cuando lo 
visité en el hospital, estaba eufórico. Yo pensé que era por su rápida y completa 
recuperación, pero, para mi sorpresa, me dijo que acababa de leer un artículo 
sobre estadísticas de accidentes de tráfico, donde se decía que las posibilidades de 
tener un percance en la carretera eran de una en un millar. Así pues, las 
posibilidades de que uno se vea implicado en dos accidentes a lo largo de su vida 
son de una en un millón, de lo que mi amigo concluyó felizmente: « Ahora que 
ya he tenido este accidente, puedo confíar en que las posibilidades de volver a 
tener otro son ínfimas...». No quise aguarle la fiesta. Estaba confundiendo la 
probabilidad de «tener dos accidentes en la vida» con la probabilidad 
condicionada de «tener un segundo accidente cuando ya se ha tenido uno con 
anterioridad» . 

No es que su conclusión no pudiera ser correcta, sino que su razonamiento 
probabilístìco era incorrecto. Si el accidente fue por su culpa, entonces podría 



haberse mostrado más cuidadoso en el futuro, evitando circular por autopistas o 
por la noche, o cambiando la moto por un vehículo más seguro. Todo esto 
reduciría sus posibilidades de verse implicado en un segundo accidente. Ahora 
bien, este argumento implica que hay una dependencia entre ambos sucesos, es 
decir, que la « condición dada» afecta a la posibilidad de un segundo accidente. 
Si no hay dependencia entre ambos sucesos (si el accidente no fue por su culpa ni 
podía hacer nada para evitarlo), entonces, por mucho cuidado que tuviera en el 
futuro, las posibilidades de sufrir otro accidente no se reducirían sólo porque ya 
había tenido uno antes. 

Para razonar con más precisión, supongamos que lanzamos una moneda 1000 
veces y en todas las ocasiones sale cara. ^Cuál es la probabilidad de que, si la 
lanzamos una vez más, vuelva a salir cara? La mayoría de los que no tienen 
formación matemática diría que las posibilidades de obtener 1001 caras son 
ínfímas, lo cual es cierto: las posibilidades son (1/2).^^, un número 
extremadamente pequeno. Pero la pregunta concierne a la probabilidad 
condicionada de que salga cara sabiendo que en los 1000 lanzamientos previos 
han salido 1000 caras. Esta probabilidad es 1/2 (dando por sentado que los sucesos 
son independientes, es decir, que el resultado de un lanzamiento es independiente 
del resultado previo). 

La razón psicológica de la confusión es que sabemos que la probabilidad de 
cada resultado es 1/2, así que, si lanzamos una moneda mil veces, esperamos 
obtener unas 500 caras y unas 500 cruces. Si después de mil lanzamientos aún no 
ha salido ninguna cruz, lo cual es posible pero sumamente raro, uno tiende a 
pensar que la primera cruz « está al caer» . En otras palabras, parecería que, 
después de que hayan salido mil caras seguidas, la probabilidad de que salga cruz 
debe ser cercana a uno. Pero esto es un error. De hecho, si hemos lanzado mil 
veces una moneda y en todas las ocasiones ha salido cara, yo sospecharía que la 
moneda está trucada, y concluiría que las posibilidades de que vuelva a salir cara 
en el próximo lanzamiento son mayores que 1/2. 

En fín, que si nos dan una moneda no trucada y la lanzamos al azar (lo que 
equivale a decir que la probabilidad de que salga cara es 1/2), la probabilidad de 
obtener mil caras seguidas es muy baja (1/2) 1^00, p ero j a p ro babilidad 
condicionada de que salga cara después de una serie de mil caras seguidas 
continúa siendo 1/2 (por supuesto, dando por sentado que los resultados de cada 
lanzamiento son independientes del anterior). 


Una cucharada de teoría de la información. 



La teoría de la información nació en 1948 ^]. Como ocurre con la 
probabilidad, el concepto de información es impreciso y altamente subjetivo. La 
misma «información» tendrá diferentes significados, efectos y valores para 
personas diferentes. 

Si yo acabo de invertir en acciones de IBM y el lector acaba de vender las 
suyas, ambos tendremos reacciones muy diferentes al leer la noticia de que 
IBM acaba de lanzar un nuevo ordenador muy avanzado. A un campesino de 
Mozambique, en cambio, la noticia le dejaría indiferente, si es que tuviera algún 
significado para él. 

A1 igual que la teoría de la probabilidad, la teoría de la información se 
desarrolló en un cuerpo matemático cuantitativo, preciso, objetivo y útil a partir 
de un concepto subjetivo e impreciso. Para lo que nos interesa en este libro, la 
teoría de la información constituye un importante hito en la comprensión del 
significado de la entropía^]. 

La teoría de la información fue introducida originalmente por Claude 
Shannon (1948) en el contexto de la telecomunicación. Luego se demostró muy 
útil en mecánica estadística, así como en lingûística, economía, psicología y 
muchos otros campos de investigación. 

Aquí me limitaré a exponer unas cuantas nociones básicas de teoría de la 
información, lo mínimo que hay que conocer para aplicar el término 
« información» en conexión con el signifícado de la entropía y responder a la 
pregunta: ^qué es lo que cambia? En el capítulo 8 argumento que la entropía no es 
más que información perdida, tal como la define la teoría de la información. 

Comencemos con un juego familiar. Uno ehge un objeto o una persona, y los 
demás tienen que averiguar qué o quién es a base de preguntas binarias, esto es, 
cuya respuesta sea sí o no. Supongamos que uno ha pensado, por ejemplo, en 
Einstein, y hay que descubrir al personaje mediante preguntas de sí o no. He aquí 
las dos « estrategias» posibles: 


«Estrategia» «Estrategia» 

burda inteligente 


1 .°^Es Nixon? 

2. °^Es Gandhi? 

3. °^,Soy yo? 


1 .^Es Varón? 

2. °^,Está vivo? 

3. °^,Es un 
político? 


4.°^Es Marilyn 4.°^Es un 
Monroe? científico? 


5.°^,Eres tú? 


5.°^,Es muy 
conocido? 


6.°/,Es Mozart? 


6.°Z,Es 

Einstein? 


7.°^,Es Niels 
Bohr? 


8 .° 



La razón por la que he calificado de « burda» a la primera estrategia y de 
« inteligente» a la segunda es bien simple, y espero que el lector esté de 
acuerdo conmigo. Si aplicamos la « estrategia» de la izquierda, podríamos 
acertar a la primera, cosa que no nos permite la « estrategia» inteligente. 
Pero acertar a la primera es altamente improbable. Es mucho más probable 
que tuviéramos que seguir preguntando indefinidamente, sin obtener nunca 
un sí por respuesta. La razón para preferir la segunda « estrategia» es que 
con cada respuesta obtenemos más informacìón (véase más adelante), es 
decir, excluimos una inmensidad de posibilidades (lo ideal sería la mitad de 
las posibilidades; véase más adelante). Si la respuesta a la primera pregunta 
es SÍ, quedan excluidas todas las mujeres. Si la respuesta a la segunda 
pregunta es NO, quedan excluidas todas las personas vivas. Con cada 
respuesta se estrecha el rango de posibilidades. La « estrategia» burda, en 
cambio, sólo permite excluir una posibilidad cada vez, con lo que el rango de 
posibilidades desconocidas prácticamente no cambia. Intuitivamente, es 
evidente que la « estrategia» inteligente nos proporciona más información 
con cada respuesta que la « estrategia» burda, aunque aún no hayamos 
definido el término « información» . Parece más sensato tener paciencia y 
optar por la « estrategia» inteligente que intentar acertar a la primera. 

Todo lo que acabo de decir es bastante cualitativo, y por eso empleo la 
palabra «estrategia» entre comillas. E1 término «información» tal como lo 
hemos usado es impreciso (lo precisaremos en el marco de la teoría de la 
información). Aun así, espero que el lector estará de acuerdo conmigo y 
apreciará intuitivamente que la primera columna corresponde a una manera de 
proceder « burda» , mientras que la segunda es más « inteligente» . Si no es así, 
debería probar el juego unas cuantas veces con ambas estrategias, y estoy 
seguro de que se convencerá de que la estrategia inteligente ciertamente es la 
más inteligente. En breve precisaremos más el juego y justificaremos por qué 
una serie de preguntas puede calificarse de « burda» y la otra de « inteligente» . 
Y lo que es más importante, el lector no tendrá más remedio que convenir 
conmigo en que la estrategia «inteligente» ciertamente es la más inteligente. 
Antes de eso, sin embargo, examinemos con más detenimiento este juego tan 
simple para intentar comprender por qué no podemos precisar los méritos de 
ambas estrategias. 

Para empezar, el lector siempre puede razonar que, sabiendo que yo soy 
científico y que probablemente pensaré en Einstein, entonces quizá sería mejor 
optar por la primera estrategia. Ahora bien, si yo sé que el lector sabe que soy un 
científico y se figurará que, por mi condición de tal, probablemente pensaré en 
Einstein, podría enganarle eligiendo a Kirk Douglas; y el lector podría 



contraatacar teniendo en cuenta que probablemente yo intentaré enganarle 
eligiendo a Kirk Douglas en vez de Einstein; y así sucesivamente. Sin duda, es 
muy diflcil llegar a alguna parte por esta vía. 

Hay muchos otros elementos de subjetividad que podrían entrar en juego. A 
modo de ilustración, el lector podría haber oído en el telediario matinal que un 
asesino en serie buscado por la policía ha sido por fin capturado, y podría 
figurarse, o saber, que yo he oído la misma noticia y, al tenerla fresca en la 
mente, es probable que piense en esa persona. 

Por eso no se puede edificar una teoría matemática de la información sobre 
la base de esta clase de juegos. Hay demasiados elementos cualitativos y 
subjetivos que se resisten a la cuantificación. Por fortuna, gracias a la teoría de la 
información de Shannon, estos juegos pueden «reducirse» para eliminar 
cualquier traza de subjetividad. Permítaseme describir otro juego que es 
esencialmente el mismo de antes, pero en una forma destilada, mucho más 
simple y susceptible de un tratamiento preciso, cuantitativo y objetivo. 

Supongamos que tenemos ocho cajas iguales (figura 2.9). Un jugador 
esconde una moneda en una caja y el otro jugador tiene que averiguar dónde 
está. Todo lo que sabe es que la moneda debe estar en una de las cajas, y que 
ninguna tiene preferencia sobre el resto. Puesto que la caja ha sido escogida al 
azar, Ia probabilidad de encontrar la moneda en una caja cualquiera es 1/8. Para 
ser neutral, la caja fue elegida mediante un número entre 1 y 8 generado 
aleatoriamente por un ordenador, así que el segundo jugador no puede valerse de 
ninguna información relevante sobre cualquier posible preferencia del primero a 
la hora de elegir la caja donde ha escondido la moneda. 

Conviene advertir que en este juego hemos eliminado cualquier traza de 
subjetividad (toda la información que necesitamos es « dónde está la moneda» ). 
La « ocultación» de la moneda puede hacerse mediante un ordenador que elige 
una caja al azar. También podemos plantear preguntas binarias al ordenador para 
averiguar la localización de la moneda. E1 juego no depende de la información 
que tengan los jugadores o el ordenador. La información requerida está dentro 
del juego mismo, con independencia de la personalidad o el conocimiento de los 
jugadores. En breve asignaremos una medida cuantitativa a dicha información. 

Por supuesto, lo que necesitamos es información relativa a « dónde está la 
moneda» . Para adquirirla, sólo se nos permite plantear preguntas binarias^] 
En vez de un número indefinido de personajes como en el juego anterior, aquí 
tenemos sólo ocho posibilidades; y lo que es más importante, las ocho 
posibilidades tienen la misma probabilidad. 1/8. 

De nuevo hay muchas estrategias posibles. Dos opciones extremas y bien 
definidas son las siguientes: 


La estrategia más burda 

La estrategia más inteligente 

1. ° i Está la moneda en la caja 1 ? 

2. ° i Está la moneda en la caja 2? 

3. ° i Está la moneda en la caja 3? 

4. ° i Está la moneda en la caja 4? 

5. ° 

1. ° i Está la moneda en la mitad 

derecha (de las ocho)? 

2. ° i Está la moneda en la mitad su- 

perior(de las cuatro restantes)? 

3. ° i Está la moneda en la mitad 

derecha (de las dos restantes)? 

4. ° jYa tengo la respuesta! 






segunda pregunta 











tercera pregunta 


primera pregunta 



N = 16 


Log 2 N = 4 



N =32 


Log 2 N = 5 


Figura 2.9. 


En primer lugar, nótese que esta vez no he entrecomillado la palabra 
estrategia. Aquí las estrategias son precisas y están bien definidas, cosa que no 
ocurría en el juego anterior. En este juego, la estrategia más burda consiste en 
preguntas del tipo ^Está la moneda en la caja kl, donde k va de 1 a 8. La 
estrategia más inteligente, en cambio, consiste en ir dividiendo el rango de 
posibilidades por la mitad. Ahora vemos por qué no podíamos defínir la estrategia 


































más inteligente en el juego anterior. Allí no estaba claro cuáles eran todas las 
posibilidades, y menos todavía si podíamos dividirlas por la mitad. Aunque nos 
limitáramos a elegir a personas que hubieran trabajado en un campo concreto, 
como puede ser la termodinámica, todavía no sabríamos cómo reducir las 
posibilidades a la mitad, o siquiera si tal división es posible en principio. 

En segundo lugar, nótese que ahora hablo de las estrategias « más burda» y 
« más inteligente» (cosa que no podía hacer en el juego anterior, de ahí que me 
limitara a califícar la primera de « burda» y la segunda de «inteligente»). La 
razón es que se puede demostrar matemáticamente que si uno aplica la estrategia 
más inteligente de manera repetida, vencerá a cualquier otra estrategia posible, 
incluida la peor de todas, o la « más burda» . Ya que no puedo presentar una 
demostración matemática, intentaré convencer al lector de que la estrategia 
« más inteligente» es mucho mejor que la « más burda» (cosa que también 
puede comprobar por sí mismo practicando este juego con un amigo o contra un 
ordenador). 

En términos cualitativos, si optamos por la estrategia «más burda», 
podríamos acertar a la primera, pero la probabilidad de que esto ocurra es 1/8, y 
la probabilidad de fallar es 7/8. Si hemos fallado con la primera pregunta (que es 
lo más probable, y tanto más cuanto mayor es el número de cajas), ahora la 
probabilidad de acertar a la segunda es 1/7 y la de volver a fallar 6/7. Si fallamos 
seis veces seguidas, tras la séptima pregunta conoceremos la respuesta correcta, 
esto es, tendremos la información para saber dónde está la moneda. Por otro 
lado, si optamos por la estrategia «más inteligente», es seguro que no 
acertaremos a la primera, ni a la segunda, pero tenemos la garantía de obtener la 
información requerida tras la tercera pregunta. Inténtese repetir este mismo 
razonamiento para el caso de una moneda escondida en una de 1000 cajas. 

E1 argumento cualitativo es el mismo del juego anterior, pero ahora puede 
hacerse más preciso y cuantitativo. Preguntando « ^Está la moneda en la caja 
1?», podríamos acertar a la primera, pero con una probabilidad muy baja. Si 
fallamos, sólo habremos eliminado la primera caja, con lo que el número de 
posibilidades se habrá reducido de 8 a 7. Por otro lado, si adoptamos la estrategia 
más inteligente, la primera pregunta elimina la mitad de las posibilidades, con lo 
que sólo quedan cuatro. La segunda pregunta elimina otra mitad, con lo que sólo 
quedan dos cajas posibles, y con la tercera pregunta obtenemos la respuesta. 

En teoría de la información, la información desconocida, es decir, la cantidad 
de información que uno debe adquirir haciendo preguntas se define a partir de la 

distribución de probabilidades^]. 

En este ejemplo, las probabilidades son: {1/8, 1/8, 1/8, 1/8, 1/8, 1/8, 1/8, 1/8}. 
Con la serie de preguntas más inteligentes, cada respuesta proporciona un 
máximo de información (lo que se conoce como un bit). Se puede demostrar que 


se obtiene la información máxima dividiendo el espacio de resultados posibles en 
dos partes igualmente probables. 

Así, si a cada paso de la estrategia más inteligente obtengo la información 
máxima, obtendré toda la información que necesito con un número mínimo de 
pasos. Vuelvo a subrayar que esto es cierto por término medio, es decir, si 
repetimos el mismo juego muchas veces, la estrategia más inteligente nos 
proporciona un método para obtener la información requerida con el mínimo 
número de preguntas. La teoría de la información también nos permite calcular 
el número medio de preguntas para cada estrategia. 

Nótese también que la cantidad de información requerida siempre es la 
misma, con independencia de la estrategia adoptada. La elección de Ia estrategia 
afecta al número de preguntas requeridas par obtener la misma información. La 
estrategia más inteligente garantiza que, por término medio, tendremos que hacer 
menos preguntas que con cualquier otra estrategia. 

Si este argumento no convence al lector, le sugiero que intente pensar en el 
mismo juego con 16 cajas. Aunque el número de cajas se ha duplicado, el 
número de preguntas requeridas por la estrategia más inteligente sólo aumenta en 
|uno! E1 número medio de preguntas requeridas por la estrategia más burda es 
mucho mayor. La razón es la misma de antes: la estrategia más inteligente 
reporta el máximo de información en cada paso, mientras que la estrategia más 
burda proporciona muy poca información en los primeros pasos. En la figura 2.9 
se ilustran otros dos casos del juego con diferentes números de cajas. E1 número 
de preguntas correspondiente a cada caso, calculado a partir de la teoría de la 
información, se muestra abajo^], 

La cuestión importante en esta fase es que cuanto mayor sea el número de 
cajas, mayor será la cantidad de información que necesitaremos para localizar 
la moneda y, por ende, mayor el número de preguntas requeridas para obtenerla. 
Resulta fácil apreciar esto intuitivamente. La cantidad de información viene 
determinada por la distribución (que en nuestro caso es {1 /N... 1 /N} para N cajas 
igualmente probables). 

Para hacer que el juego sea totalmente impersonal y, por ende, totalmente 
objetivo, podemos imaginar que jugamos contra un ordenador. Éste elige una 
caja y nosotros le hacemos preguntas binarias. Supongamos que pagamos un 
céntimo por respuesta. Seguramente preferiríamos obtener la información 
buscada (el escondite de la moneda) pagando lo menos posible. Adoptando la 
estrategia más inteligente obtendremos el máximo partido de nuestro dinero. En 
una definición específica de las unidades de información, se puede hacer que la 
cantidad de « información» sea igual al número de preguntas requeridas por la 
estrategia más inteligente. 

Resumamos el caso de Acajas y una moneda escondida en una de ellas. 


Sabemos que la caja se eligió al azar, esto es, la persona que escondió la moneda 
no tenía ninguna « preferencia» por ninguna de las cajas. En otras palabras, cada 
caja tenía una probabilidad 1 /N de ser seleccionada. En este caso, es evidente que 
cuanto mayor sea el número de cajas, mayor será el número de preguntas 
requeridas para localizar Ia moneda escondida. Podemos decir que cuanto 
mayor sea el número de cajas, mayor será la cantidad de información 
desconocida, y por eso tenemos que hacer más preguntas. 

Demos un paso más. Ahora nos dicen que se han escondido dos monedas en 
Acaj as. En aras de la concreción, supongamos que las monedas se han colocado 
en cajas diferentes. Una vezmás, sabemos que las cajas se han elegido al azar. 
En tal caso, la probabilidad de encontrar la primera moneda en una caja 
concreta es 1 /N, y la probabilidad de encontrar la otra moneda una vez localizada 
la primera es l/(N - 1). Es obvio que en este juego tenemos que hacer más 
preguntas para localizar las dos monedas. En general, para un número dado de 
cajasiV, cuanto mayor sea el número n de monedas escondidas más preguntas 
tendremos que hacer para localizarlas; hasta que n se hace mayor que N/ 2, 

momento en que podemos pasar a preguntarnos qué cajas están vacías^] Una 
vez localizadas las cajas vacías, sabremos cuáles están ocupadas. Para n = N 
(igual que para n = 0) tenemos toda la información ya de entrada, por lo que no 
necesitamos hacer ninguna pregunta. 


Una pizca de matemáticas, jisica y química. 


Como he asegurado en el prefacio, para entender este Ubro no se necesita 
ningún conocimiento matemático avanzado. Si el lector no sabe absolutamente 
nada de matemáticas, le sugiero que se ejercite pensando en grandes números, 
números de una inmensidad inimaginable. También es útil estar familiarizado con 
la notación exponencial, que no es más que una notación abreviada para números 
grandes. Un miUón se escribe 10^, que quiere decir un uno seguido de seis ceros; 
o mejor aún, diez multiplicado seis veces por sí mismo: 10^ = 
10 x 10 x 10 x 10 x 10 x 10. 

Un millón es un número fácil de escribir tal cual, pero con números como 
10 ^ (que viene a ser el número de átomos contenidos en un centímetro cúbico 
de gas) resulta inconveniente o imposible emplear la notación explícita normal. 
Con números de la forma 10^ ^00 tendríamos que Uenar más de una página de 
ceros, lo cual no es nada práctico. Si tenemos un número de la forma 10^® \ 


podríamos pasamos la vida escribiendo ceros y no acabaríamos. 

Para hacernos una idea de la clase de números de los que estamos hablando, 
casi todos podemos escribir el número 1000 (un uno seguido de tres ceros) en un 
segundo. E1 lector quizá sea más rápido y pueda escribir el número 10 000 en un 
segundo. Pero supongamos que somos lo bastante rápidos para escribir el número 
1 000 000 (un uno seguido de seis ceros, es decir, un millón) en un segundo. 

6 x 60 x 60 x 24 x 365 x 100 = 18 921 600 000 

Pues bien, al cabo de cien anos podríamos escribir un uno seguido de 10 
ceros, lo que viene a ser 10 10 ceros. 

Un uno seguido de 10 10 ceros es ciertamente grande. Podemos representarlo 
como: 


10 (10 10 )_ 10 (un 1 seguido de 10ceros)_ 10 10 000 000 000 

Si pudiéramos continuar escribiendo ceros no ya durante cien anos, sino 
durante 15 000 millones de anos (la edad estimada del universo), el número 
escrito explícitamente tendría alrededor de ÌO 1 2 ^ ceros, es decir 

10 (10^) = 10 (un 1 seguido de 18ceros). 

Éste es un número inimaginablemente grande. Como más adelante veremos, 
la segunda ley tiene que ver con sucesos tan infrecuentes que sólo « ocurrirían» 

una vezde cada 10 10 experimentos^^l. Estos números están mucho más allá 
de lo representable explícitamente, aun cuando pudiéramos sentarnos a escribir 
durante 15 000 millones de anos. 

Pero es la clase de números que nos encontraremos cuando consideremos la 
segunda ley de la termodinámica desde el punto de vista molecular. Ésa es toda 
la matemática que necesitaremos para captar y comprender la segunda ley. Si el 
lector quiere seguir las notas más detalladas, Ie será útil familiarizarse con las tres 
notaciones siguientes: 

1) Valor absoluto. E1 valor absoluto de un número, denotado como 
|x|, no es más que el valor positivo de x. En otras palabras, si x es 
positivo no cambia nada, y si es negativo simplemente se 
suprime el signo « menos» . Así, |5| = 5, y |—5| = 5.Esto es bien 
simple. 

2) Logaritmo de un número^-L Es una notación extremadamente 


útil en matemáticas, ya que facilita la escritura de números 
muy grandes. E1 logaritmo de un número x es el número que 
hay que colocar 10 ^QUI p ara obtener x. jMuy simple! Lo 
denotamos como logjo x - 

Ejemplo: ^cuál es el número que hay que colocar 10p ara 
obtener 1000? La respuesta es 3, ya que 1(P = 1000. Se escribe logjo 
1000 = 3. ^Cuál es el logaritmo de 10 000? Sólo hay que hacer 10 000 
= 10^, y tenemos que logjo 10 000 = 4. Esto no es más que el 
número de veces que se multiplica 10 por sí mismo. Aunque no 
necesitaremos considerar el logaritmo de cualquier número 
arbitrario, es evidente que logjol975 es mayor que 3 y menor que 4. 
E1 símbolo logjo se denomina logaritmo en base 10. Similarmente, el 
logaritmo en base 2 de x, o log 2 x, es el número que hay que colocar 
2 AQUI p ara 0 5 t ener x p or ejemplo, el número que hay que poner 
2 AQUI p ara 0 5 t ener 16 es 4, ya que 2^ = 16 o, equivalentemente, es 
el número de veces que hay que multiplicar 2 por sí mismo para 
obtener 16. Se puede definir log 2 x para cualquier número positivo x, 
pero por simplicidad limitaremos esta notación a los números de la 
forma 2 ENTERO. En teoría de la información, la cantidad de 
información que necesitamos para localizar una moneda escondida 
en una serie de Acajas igualmente probables se define como log 2 ÌV. 
3) Factoriales. Los matemáticos emplean notaciones abreviadas 
para la suma (£) y el producto (II). Aquí no las necesitaremos, 
pero hay una notación muy útil para un producto especial, que 
se denota como N\ Se trata del producto de todos los números de 
1 a N. Así, para N=5,M= Ix2x3x4x5. Para N= 100, N\ 
= 1 x 2x 3 x ... x 100. 

Hemos visto todas las matemáticas que necesitaremos. 

la física? Para comprender la segunda ley tampoco se necesita ningún 
conocimiento de física, ni de química. Pero hay algo que el lector debería saber. 
En las notas de Richard Feynman encontramos lo siguiente: « Si, en algún 
cataclismo, todo el conocimiento científico quedara destruido y sólo un 
pensamiento pasara a la siguiente generación de criaturas, <,qué enunciado 
contendría más información con menos palabras? Yo creo que sería la hipótesis 
atómica (o el hecho atómico, o como se le quiera llamar), la idea de que todas 
las cosas están hechas de átomos, pequenas partículas que se encuentran en 
perpetuo movimiento, atrayéndose mutuamente cuando se separan un poco, pero 



repeliéndose cuando se apretujan unas con otras» . 

Toda la materia está compuesta de átomos (y moléculas). Aunque hoy en día 
este hecho se da por sentado, no siempre fue así. La estructura atómica de la 
materia tiene sus raíces en la filosofía de los antiguos griegos, y se remonta a 
más de dos mil anos atrás. No era un postulado de la física, sino una especulación 
filosófica. Durante casi dos milenios no hubo prueba alguna de la existencia de 
los átomos. Incluso a las puertas del siglo pasado, la hipótesis atómica todavía era 
objeto de vigoroso debate. Cuando se formuló la segunda ley de la 
termodinámica, la naturaleza atómica de la materia estaba lejos de ser un hecho 
establecido. Boltzmann era uno de sus defensores y, como ya he senalado, abrió 
la puerta a la interpretación molecular de la segunda ley. Tuvo que enfrentarse a 
poderosos oponentes que sostenían que la existencia de los átomos no era más 
que una hipótesis, por lo que la estructura atómica de la materia era una mera 
especulación que no tenía cabida en la física. Pero hoy es un hecho aceptado. 

E1 segundo hecho que el lector debe conocer es algo más sutil. Se trata de la 
indistinguibilidad de átomos y moléculas. Dedicaremos mucho tiempo a jugar 
con dados o monedas. Dos monedas podrían diferir en color, tamano, forma, 
etcétera (véase la figura 2.10). 

En la vida diaria usamos los términos «idéntico» e « indistinguible» como 
sinónimos. Las dos monedas de la figura 2.11 son idénticas en cuanto a forma, 
tamano, color y lo que uno quiera. 

Diremos que son distinguibles si, cuando se mueven, podemos seguir cada 
moneda con la vista y en cualquier momento dado podemos especificar qué 
moneda procede de qué punto. 

Supongamos que, en la figura 2.11, intercambiamos las dos monedas de la 
izquierda para obtener la configuración de la derecha. Si las monedas son 
idénticas, entonces no podemos diferenciar entre ambas configuraciones. Pero si 
seguimos el proceso de intercambio, podemos especificar de dónde viene cada 
moneda. En principio, esto es imposible cuando se trata de moléculas idénticas. 
En tales casos preferimos hablar de indistinguibilidad en vezde identidad. 

Considérese un sistema de dos compartimentos (figura 2.12). Inicialmente 
tenemos 5 monedas en cada compartimento. Las monedas son idénticas en todos 
los aspectos. Ahora eliminamos la separación y agitamos el sistema entero. 
Después de agitar veremos una nueva configuración, como la de la derecha. 

Decimos que las partículas (en este caso las monedas) son distinguibles, aun 
cuando sean idénticas, si en todo momento podemos especificar de qué 
compartimento procede cada moneda, simplemente porque podemos seguir las 
trayectorias de todas las partículas. Decimos que las partículas son indistinguibles 
cuando, en el experimento de antes, no podemos decir cuál es cuál después de 
eliminar la separación. No podemos seguir las trayectorias de las partículas. Este 
hecho era ajeno a la mecánica clásica. En el dominio clásico siempre pensamos 



que las partículas de cualquier tamano están « etiquetadas» o, al menos en 
principio, son «etiquetables» . Las ecuaciones del movimiento de Newton 
predicen las trayectorias de cada partícula específica del sistema. Pero en 
mecánica cuántica esto no es posible enprìncipio 



Figura 2.11. 


En los dos capítulos que siguen veremos muchos ejemplos donde partimos de 
dados distinguibles y voluntariamente ignoramos su distinguibilidad. Este proceso 
de «desetiquetado» será esencial para comprender la segunda ley de la 
termodinámica. 

En cuanto a la química, no hace falta saber nada más allá del hecho de que la 
materia está constituida por átomos y moléculas. Pero si uno quiere entender el 


ejemplo de la última parte del capítulo 7 (que es interesante, pero no esencial), 
tiene que saber que algunas moléculas tienen un centro asimétrico (o centro 
quiral), y tales moléculas se presentan en pares, denotados /y í/^1] l os (j os 
tipos (llamados enantiómeros) son casi idénticos, pero el uno es la imagen 
especular del otro. Todos los aminoácidos (ios constituyentes de las proteínas, que 
a su vez son los constituyentes de los músculos y muchos otros tejidos corporales) 
se presentan en una versión de estos pares. Un ejemplo es la alanina (fîgura 
2.13). 

La mayoría de aminoácidos naturales son del tipo /. Se distinguen por su 
actividad óptica. Lo único que tenemos que saber es que estos pares de moléculas 
son casi iguales en lo que respecta a parámetros moleculares como la masa, el 
momento de inercia, el momento dipolar, etcétera. Las moléculas del mismo tipo 
son indistinguibles, pero la forma /y la forma d sí son distinguibles y, en principio, 
separables. 
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Figura 2.13. 


Hasta aquí hemos discutido todos los « prerrequisitos» que se necesitan para 
comprender el resto del libro. En realidad, el único prerrequisito para entender 
los demás prerrequisitos examinados en este capítulo es el sentido común. A 
modo de autotest, inténtese resolver los dos siguientes problemas. 






Un problema de lotería. 


Una lotería estatal ha emitido un millón de boletos. Cada uno se vendió a 10 
dólares, así que se recaudan 10 millones de dólares. E1 premio para el número 
ganador es de 1 millón de dólares. Otros 999 000 números ganan un premio de 1 
dólar estadounidense o su equivalente, pero en distintas monedas, y hay otros 999 
premios de 10 dólares, también en distintas monedas. En total, la lotería 
distribuye 2 008 990 dólares en premios, lo que deja una ganancia neta de 
8 000 000 de dólares. Nótese que los premios de uno y de diez dólares se 
entregan en monedas diferentes y son, por lo tanto, distinguibles. En otras 
palabras, dos personas que ganan un premio por valor de un dólar reciben 
cantidades diferentes, esto es, diferentes premios con el mismo valor. 

Ahí van las preguntas: 

Respóndase SÍ o NO a las primeras tres preguntas. Compro un solo boleto y 

1 ) ^Es creíble la afirmación de que he ganado un millón de dólares 
en la lotería? 

2 ) ^Es creíble la afirmación, que hice el día anterior, de que he 
ganado el equivalente a un dólar en moneda india? 

3) ^Es creíble la afirmación, que hice el día anterior, de que he 
ganado el equivalente a diez dólares en moneda china? Ahora 
estímense las siguientes probabilidades: 

4) ^Cuál es la probabilidad de ganar el premio de un millón de 
dólares? 

5) ^Cuál es la probabilidad de ganar el dólar en moneda india? 

6 ) ^Cuál es la probabilidad de ganar los diez dólares en moneda 
china? 

7) ^Cuál es la probabilidad de ganar el premio por valor de un 
dólar? 

8 ) ^Cuál es la probabilidad de ganar el premio por valor de diez 
dólares? 

9) Tras haber respondido las preguntas 4-8, yevisaría el lector sus 
respuestas a las preguntas 1-3? 

E1 lector encontrará todas las respuestas al final del capítulo (páginas 90-91). 


Un problema ele orden-desorden. 



Obsérvense los patrones de las dos figuras insertas al comienzo de este libro. 
Los he etiquetado como ordenado y desordenado. Llamémoslos B y 
Ahora que ya tenemos nociones elementales de probabilidad, inténtese responder 
a las siguientes preguntas. Supongamos que he empleado 200 dados para 
construir las figuras^íy B. 

1) ^Es creíble la afírmación de que obtuve las dos configuraciones 
Ay B lanzando los 200 dados dos veces sobre el tablero? 

2) ^Es creíble la afirmación de que dispuse los dados para 
componer la configuración A, y luego obtuve la B tras agitar la 
mesa durante unos segundos? 

3) ^Es creíble la afirmación de que compuse la configuración B y 
luego obtuve la A tras agitar la mesa durante unos segundos? 

Para responder a las preguntas anteriores, sólo hay que hacer una 
estimación cuantitativa de la probabilidad de las configuraciones A y 
B. Veamos si el lector es capaz de hacerlo. Supongamos que el 
tablero está dividido en, digamos, 1000 casillas. Sólo puede haber un 
dado por casilla. La orientación del dado no importa, sólo importa la 
cara superior. Una configuración es la especifícación exacta de la 
cara superior y Ia localización (la casilla) de cada dado. Hay 200 
dados en total (en las fíguras tanto el número de dados como el de 
casillas es diferente). Cada dado puede exhibir uno de seis números 
(1, 2... 6) en su cara superior, y puede situarse en cualquiera de las 
1000 casillas (pero no más de un dado por casilla, sin que importe su 
orientación). Ahora estímense las probabilidades siguientes: 

4) La probabilidad de obtener la confíguraciónyf. 

5) La probabilidad de obtener la configuración B. 

6 ) La probabilidad de obtener la configuración A, pero sin 

considerar el número de puntos de cada dado. 

7) La probabilidad de obtener la configuración B , pero sin 

considerar el número de puntos de cada dado. 

Después de practicar con éstas (minúsculas) probabilidades y 
presumir que se han calculado correctamente, he dejado para el 
final otras dos preguntas (Ias más fáciles). 

8) ^Es creíble la afírmación de que volví a lanzar los 200 dados dos 
veces y obtuve exactamente las mismas dos confíguraciones A 
y 5? 

Ahora obsérvese atentamente la configuración/4. ^Hay algún patrón 


o letra reconocible? Fijémonos sólo en los dados con un punto en su 
cara superior. ^Reconoce ahora el lector alguna pauta? Si no es así, 
puede ver la confíguración oculta en la fígura del final de este libro 
(de ahí las denominaciones^, de Arieh, y B, de Boltzmann). Y ahora 
la última pregunta: 

9) ^Revisaría el lector alguna de sus respuestas a las 8 preguntas 
anteriores? 

Las respuestas correspondientes aparecen al fínal de este capítulo (página 
91). 


Un desafio. 


E1 problema que voy a plantear ahora tiene una gran signifícación histórica. 
Se considera uno de los problemas cuya solución no sólo contribuyó a consolidar 
el concepto de probabilidad, sino que transformó las cábalas de los salones de 
juego en razonamiento matemático. 

Ni el problema ni su solución son relevantes para la comprensión de la 
segunda ley. Mi objetivo al contar esta historia es triple. En primer lugar, dar una 
idea del tipo de problemas que se planteaban en la época del nacimiento de la 
teoría de la probabilidad. En segundo lugar, dar una idea de las difícultades que 
surgen a la hora de calcular probabilidades, incluso en problemas que parecen 
muy simples de entrada. En tercer lugar, si al lector le gustan los problemas 
«tramposos» , saboreará la solución deliciosamente simple que pueden ofrecer 
los matemáticos a un problema aparentemente insoluble. 

E1 problema en cuestión le fue planteado a Blaise Pascal por su amigo el 
caballero De Meré en 1654^-L 

Supongamos que dos jugadores ponen cada uno diez dólares sobre la mesa. 
Cada uno apuesta por un número del 1 al 6. Supongamos que Dan eligió el 4 y 
Linda eligió el 6. Las reglas del juego son muy simples. Se tira un dado y se 
registra la secuencia de resultados. Dan suma un punto cada vezque sale un 4, y 
Linda hace lo propio cada vez que sale un 6. E1 primero que sume tres puntos 
gana los 20 dólares apostados. Una posible secuencia podría ser: 

1,4, 5, 6, 3, 2, 4, 6,3,4 

Puesto que el número 4 ha salido tres veces. Dan gana los 20 dólares. 

Ahora supongamos que comienza otra partida y, al cabo de un tiempo, la 
secuencia de resultados es: 


1,3, 4, 5, 2, 6, 2,5, 1, 1,5, 6, 2, 1,5 

En este punto surge un imprevisto y la partida debe darse por terminada. La 
cuestión es cómo deben repartirse los 20 dólares entre los dos jugadores. 

Nótese que el problema no se plantearía si las reglas del juego dispusieran 
cómo debe repartirse el dinero apostado en caso de interrupción forzosa de la 
partida. Pero si no se especifica, no está claro cómo debe hacerse el reparto. 

Parece claro que, puesto que Dan ha sumado un punto y Linda ha sumado 
dos, esta última debería llevarse más dinero. Pero ^cuánto más? Queremos 
decidir cuál es la manera más justa de dividir el dinero dada la secuencia de 
resultados. Ahora bien, ^qué entendemos por más justo, cuando hablamos de 
reparto? Dado que Linda ha sumado el doble de puntos que Dan, ^debería 
llevarse el doble de dinero?quizá sería más justo simplemente retornar a cada 
uno los 10 dólares apostados, ya que el ganador ha quedado sin determinar? 
quizás habría que darle todo el dinero a Linda, porque ha quedado más « cerca» 
de la victoria que Dan? 

Durante varios anos, Blaise Pascal y Pierre de Fermat mantuvieron una 
correspondencia que fue la semilla de la teoría de la probabilidad. Téngase en 
cuenta que en el siglo XVII el concepto de probabilidad todavía tenía un largo 
camino por recorrer antes de consolidarse. La dificultad no residía sólo en hallar 
la solución matemática, sino también en determinar en qué consistía el problema, 
es decir, qué significa encontrar un método justo de repartir una suma. 

La respuesta a la última cuestión es la siguiente: 

Puesto que no había una regla específica para dividir la suma en caso de 
interrupción del juego, la manera « más justa» sería dividirla según la razón 
entre las probabilidades de ganar de uno y otro jugador caso de que el juego 
hubiera continuado. 

A1 plantear el problema en función de las probabilidades se supera un primer 
obstáculo. Ahora tenemos un problema bien formulado. Pero ^cómo se calculan 
las probabilidades buscadas? Parece que Linda tiene más posibilidades que Dan 
de ganar porque está « más cerca» de reunir tres puntos. Podemos calcular 
fácilmente que la probabilidad de que Dan gane en la próxima tirada es cero, 
mientras que la probabilidad de que gane Linda es 1/6, y la probabilidad de que 
no gane ninguno de los dos es 5/6. Podemos calcular las probabilidades después 
de dos tiradas, de tres tiradas, etcétera. E1 cálculo se complica mucho y, en 
principio, hay que hallar la suma de una serie infinita, así que la solución 
matemática del problema por esta vía no es fácil. Intente el lector calcular la 
probabilidad de ganar de cada jugador al cabo de dos tiradas, y luego de tres, y 
verá lo enrevesado que puede resultar. Pero si a uno le gustan las matemáticas, le 
encantará la solución simple, basada en resolver una ecuación de una incógnita, 
que se ofrece al final de este capítulo (página 92). 



Respuestas a los problemas. 


Respuestas a los problemas de ruleta. 

En todos estos problemas he elegido la misma secuencia: {1, 2, 3, 4, 5, 6}, 
cuya probabilidad de ganar es 1/2. Si elegimos el suceso disjunto {7, 8, 9, 10, 11, 
12 ), entonces la probabilidad condicionada es: 

Pr {BIA} = Pr {7, 8, 9, 10, 11, 12/4} =0 

Esto es así porque la ocurrencia de A excluye la ocurrencia de B. En el 
primer ejemplo de secuencia superpuesta tenemos (véase la figura 2.14). 

Pr {BIA} = Pr{6, 7, 8, 9, 10, 11/4} = 1/6 < 1/2 

Aquí el conocimiento de que ha ocurrido 4 significa que sólo podemos haber 
ganado si la bola se detuvo en el « 6» . De ahí que la probabilidad sea 1/6, menor 
que Pr { B } = 1/2, lo que quiere decir que hay una correlación negativa. 

Similarmente, para B = {5, 6, 7, 8, 9, 10} tenemos: 

Pr {BIA} = Pr {5, 6, 7, 8, 9, 10/4} = 2/6 < 1/2 

Aquí, « dado 4» , sólo ganaremos si la bola se detiene en « 5» o « 6» , por lo 
que la probabilidad condicionada es 2/6, que sigue siendo menor que Pr {5} = 
1 / 2 . 

En el tercer caso, B = {4, 5, 6, 7, 8, 9}, de donde: 

Pr {B/A} =Pr {4, 5, 6, 7, 8, 9/4} =3/6= 1/2 

Aquí la probabilidad condicionada es 1/2, exactamente igual que la 
probabilidad «no condicionada». Pr {5} = 1/2, lo que significa que ambos 
sucesos son independientes, o no correlacionados. 

Para los últimos tres ejemplos tenemos: 

Pr {BIA} = Pr {3,4, 5, 6, 7, 8/A} = 4/6 > 1/2. 

Pr {BIA} = Pr {2, 3,4, 5, 6, 7/4} = 5/6 > 1/2. 

Pr {BIA} = Pr {1, 2, 3,4, 5, 6/4} = 6/6 = 1 > 1/2 





Figura 2.14. 


En el último ejemplo, saber que ha ocurrido A hace que la ocurrencia de B 
sea segura. En estos ejemplos hemos visto que los sucesos superpuestos pueden 
estar correlacionados positiva o negativamente, o no estar correlacionados en 
absoluto. 

Respuesta a « un problema de lotería» . 

1) La mayoría probablemente no lo creerá, aunque no es 
imposible. 

2) La mayoría probablemente lo creerá, aunque las posibilidades 
son tan reducidas como las de ganar el premio gordo. 

3) La mayoría probablemente lo creerá, aunque las posibilidades 
son tan reducidas como las de ganar el premio gordo. 

4) Las posibilidades son una en un millón (10 - ^). 

5) Las posibilidades son una en un millón (10 ^). 

6 ) Las posibilidades son una en un millón (10 - ^). 

7) La probabilidad es 999 000/1 000 000 « 1. 

8 ) La probabilidad es 999/1 000 000 a 1/1000. 

9) Si la respuesta a 1 ha sido NO, es bastante correcta. 

Las posibilidades son ciertamente reducidas. Quienes hayan respondido con 
un SÍ a 2 y 3 probablemente están equivocados, porque las posibilidades son tan 
escasas como las de ganar el premio gordo. 

Quienes hayan respondido con un SÍ a las preguntas 2 y 3 probablemente 



están confundiendo el suceso exacto «ganar un dólar en una moneda 
específica» con el suceso inespecífico^] «ganar un dólar en cualquier 
moneda» . E1 primero es altamente improbable, mientras que el segundo es casi 
seguro. 

Respuesta a « un problema de orden-desorden» . 


1) Probablemente debería creerse A pero no B Véase más abajo. 

2) No debería creerse. 

3) Podría ser creíble, si se considera que A es una configuración 
obtenida aleatoriamente. Pero no debería creerse si A se 
considera una confíguración específica. 

4) La probabilidad de que un dado muestre una cara específica y 
esté en una casilla específica es 1/6 x 1/1000. La probabilidad de 
que los 200 dados muestren caras específícas y se sitúen en 
casillas específicas (nótese que los dados son distinguibles y no 
se permite más de uno por casilla) es (l/6).^0 1/1000 x 999 x 
998 x ... x 801. Ésta es una probabilidad pequenísima. 

5) La misma respuesta que para 4. 

6) La probabilidad es 1/1000 x 999 x 998 x ... x 801, que sigue 
siendo muy pequena. 

7) La probabilidad es la misma de antes. 

8) Probablemente no debería creerse. Más de uno podría estar 
tentado de presumir que obtuve la configuración A de manera 
aleatoria, pero la pregunta se refiere a la confíguración exacta. 

9) Hay que tener claro que siempre que la pregunta se refíere a 
una configuración específica como A o B, la probabilidad es 
extremadamente baja. Pero si consideramos que A es una 
configuración aleatoria, uno podría estar en lo cierto al asignar 
una probabilidad mayor a esta configuración. La razón es que 
hay muchas configuraciones que «parecen» la misma que A, 
de ahí que una configuración aleatoria tenga una probabilidad 
mayor. Pero cuando uno comprueba que A contiene la palabra 
« Arieh» , entonces deja de ser una configuración aleatoria. 

Respuesta a « un desafío» . 

La solución al problema es la siguiente. Denotemos como X la probabilidad 
de que gane Linda. En la próxima tirada hay tres posibilidades mutuamente 
excluyentes: 


I: resultado {6} con probabilidad 1/6. 

II: resultado {4} con probabilidad 1/6. 

III: resultado {1, 2, 3, 5} con probabilidad 4/6. 

Denotemos el suceso «Linda gana» como LG. Se cumple la siguiente 
ecuación. 


X = Pr(LG) = Pr(I) Pr(LG/I) + Pr(II) Pr(LG/II) + 

Pr(III) Pr(LG/III) =1/6x1 + 1/6 x 1/2 + 4/6 x X 
Se trata de una ecuación de una incógnita: 6X = 3/2 + 4X. La solución es X 
= 3/4. 


Nótese que los sucesos I, II y III se refieren a resultados posibles en la 
próxima tirada. E1 suceso LG se refiere a la victoria de Linda con independencia 
del número de tiradas subsiguientes. La ecuación anterior quiere decir que la 
probabilidad de que gane Linda es la suma de las tres probabilidades de los tres 
sucesos mutuamente excluyentes. Si ocurre I, entonces ella gana con 
probabilidad 1. Si ocurre II, entonces la probabilidad de que gane Linda es 1/2. Si 
ocurre III, entonces la probabilidad de que gane es X, la misma que tenía al 
interrumpirse eljuego. 


50 % 



Fin del capítulo 2. 


3 

Jugando con dados reales 


Un dado. 


Comenzaremos con un juego bastante soso. E1 lector elige un número entre 1 
y 6, digamos «4», y yo elijo otro número diferente también entre 1 y 6, 
digamos « 3» . Lanzamos el dado. E1 ganador será aquel cuyo número salga 
antes. Este juego no requiere ningún esfuerzo intelectual. No hay ningún 
resultado preferente: todos son igualmente probables, y ambos jugadores tienen 
las mismas posibilidades de ganar o perder. Si repetimos el juego muchas veces, 
es probable que, en promedio, ambos jugadores acaben empatados (suponiendo, 
por supuesto, que el dado no esté sesgado). ^Cómo lo sabemos? Porque hemos 
aceptado el hecho de que la probabilidad de cada resultado es 1/6 y también 
creemos, por experiencia, que nadie puede desafiar las leyes de la probabilidad. 
Pero esto no siempre fue así. En otros tiempos se creía que algunas personas 
tenían un poder divino que les permitía predecir el resultado del lanzamiento de 
un dado, o que era la voluntad divina la que determinaba los resultados. Así, si 
conseguíamos comunicarnos con « Él» , directamente o a través de un mediador, 
podíamos anticipar el resultado^] Hoy día, sin embargo, cuando consideramos 
un juego de dados como el descrito, damos por sentado que hay seis y sólo seis 
resultados posibles (fígura 3.1) y que todos tienen la misma probabilidad, 1/6. La 
siguiente tabla resulta sencilla: 


lassi 


Figura 3.1. 






Resultado: 1 2 3 4 5 6 

Probabilidad: 1/6 1/6 1/6 1/6 1/6 1/6 


Dos dados. 


Jugar con dos dados es un poco más complicado. Hay diferentes 
posibilidades. Por ejemplo, podríamos apostar por un resultado específico, como 
« dado blanco 6, dado azul 1» . Hay 36 resultados específicos posibles: 


1 . 1 , 

2 . 1 , 

3 . 1 , 

4 . 1 , 

5 . 1 , 

6 . 1 , 


1 . 2 , 

2 . 2 , 

3 . 2 , 

4 . 2 , 

5 . 2 , 

6 . 2 , 


1 . 3 , 

2 . 3 , 

3 . 3 , 

4 . 3 , 

5 . 3 , 

6 . 3 , 


1 . 4 , 

2 . 4 , 

3 . 4 , 

4 . 4 , 

5 . 4 , 

6 . 4 , 


1 . 5 , 

2 . 5 , 

3 . 5 , 

4 . 5 , 

5 . 5 , 

6 . 5 , 


1.6 

2.6 

3.6 

4.6 

5.6 

6.6 


Es obvio que todos estos resultados son igualmente probables. ^Cómo lo sé? 
Suponiendo que el dado es insesgado y los resultados son independientes (no se 
afectan mutuamente), entonces su equiprobabilidad es de sentido común. Una 
respuesta alternativa es que cada resultado de un dado tiene una probabilidad de 
1/6, por lo que cada resultado específico del lanzamiento de un par de dados es el 
producto de las probabilidades de los resultados de cada dado, o 1/6 veces 1/6, 
que es 1/36. Este argumento requiere aplicar la ley de que la probabilidad de dos 
sucesos independientes es el producto de las probabilidades de cada uno. Pero, en 
última instancia, esta ley también se basa en el sentido común. 

Como en el caso de un dado, este juego es aburrido y poco interesante, y 
tampoco requiere ningún esfuerzo mental. Un juego algo más atractivo es 
apostar por la suma de los resultados de dos dados, con independencia del 
resultado concreto o el color de cada dado. Los resultados posibles de este juego 






son: 


Resultado: 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 

En total tenemos once resultados posibles. Nos referiremos a ellos como 
sucesos inespecíficos, por las razones que se dan más adelante^] $i tuviéramos 
que apostar por un resultado, (,por cuál nos decidiríamos? Adiferencia de los dos 
juegos anteriores, aquí hay que pensar un poco. No mucho, y desde luego nada 
que exceda la capacidad del lector. 

No hay duda de que los resultados listados no son sucesos elementales, ya que 
no son igualmente probables. Como puede verse en la figura 3.2a, o contando uno 
mismo, cada suceso es la suma (o unión) de sucesos elementales. En este juego 
tenemos los mismos sucesos elementales que en el anterior, cada uno con 
probabilidad 1/36. Antes de calcular las probabilidades de los sucesos compuestos 
(las sumas de las puntuaciones de dos dados), nótese que en la figura 3.2a los 
sucesos de igual suma se alinean a lo largo de la diagonal principal del cuadrado. 
E1 mismo cuadrado girado 45° (en el sentido de las agujas del reloj) se reproduce 
en la figura 3.2b. Tras constatar que podemos contar el número de sucesos 
específicos (o elementales) contenidos en cada suceso compuesto, podemos 
calcular su probabilidad. Para facilitar el recuento, hemos « comprimido» la 
figura 3.2b para obtener la figura 3.2c (donde cada par se ha vuelto a girar en 
sentido contrario a las agujas del reloj) y hemos reagrupado los pares de igual 


suma. 


Sucesos 2 3 

compuestos 
Multiplicidad 1 2 

Probabilidad 1/36 2/36 


4 5 6 7 8 

3 4 5 6 5 

3/36 4/36 5/36 6/36 5/36 


9 10 11 12 

4 3 2 1 

4/36 3/36 2/36 1/36 


La tabla de arriba muestra las probabilidades de los sucesos compuestos. La 
« multiplicidad» no es más que el número de sucesos específicos que comprende 
el suceso inespecífíco. ^Cómo sabemos que éstas son las probabilidades 
correctas? Una vez más, apelo al sentido común. E1 lector debería convencerse 





de ello, y si no lo está, puede repetir el juego unos cuantos millones de veces y 
registrar la frecuencia de cada resultado. Pero no se lo aconsejo. Debería confiar 
en que su sentido común le lleve a las probabilidades correctas o, si no, efectuar 
un millón de experimentos mentales y entrever cuántas veces saldrá cada suma. 
Una vez se haya convencido, compruebe que la suma de las probabilidades de 
todos los resultados posibles da 1, como tiene que ser. 

♦♦ % 

* * % 

* * * * 
***** 
****** 
***** 

* * * * 

* * * 

* * 


Figura 3.2b. 


Con este bagaje, procedamos a jugar. ^Por qué resultado apostaríamos? 
Obviamente, descartaríamos el 2 o el 12. i,Por qué? Porque estos sucesos 


sólo incluyen un suceso específico (o elemental). Si nos fijamos en la figura 
3.2b, vemos que la mejor elección es el 7. No hay nada mágico en este 
número. Ocurre que, en este juego concreto, la suma 7 comprende el 
mayor número de resultados específicos; de ahí que sea el resultado más 
probable. Por supuesto, sijugamos una sola vezpodríamos apostar por el 2 y 
ganar. Pero si el lector apuesta por el 2 y yo por el 7, y jugamos muchas 
veces, yo ganaré las más de las veces. Como indica la tabla, las 
posibilidades son 6:1. En la figura 3.3 se representa el número de sucesos 
elementales (o configuraciones específicas) para las sumas posibles de los 
juegos con uno y con dos dados. 


Figura 3.2c. 


Dominado este juego, podemos proceder al siguiente. Se trata de una variante 
algo más difìcil, pero nos situará en la vía correcta hacia la comprensión de la 
segunda ley de la termodinámica. 


Tres dados. 


Este juego es esencialmente el mismo que el anterior, pero es un poco más 
dificil y entrana más cálculos. Se juega con tres dados, y se calcula la suma de 
los resultados parciales, con independencia de los puntos o del color de cada 
dado. 
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Figura 3.3. 


En principio, no hemos anadido nada nuevo, aparte de que el cálculo de las 
sumas es más tedioso. De hecho, éste es justo el tipo de juego a partir del cual 
evolucionó la teoría de la probabilidad. ^Cuál es la mejor apuesta? Esta pregunta 
se trasladó a los matemáticos antes del establecimiento de la teoría de la 
probabilidad (véase el capítulo 2). 

La lista de resultados posibles es: 

3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 

En total hay 16 posibilidades. Listar todos los resultados específicos (por 
ejemplo, {azul = 1, rojo = 4, blanco =3}) requeriría mucho espacio. En total hay 
6^ = 216 resultados específicos posibles. Obviamente, no deberíamos apostar al 3 
ni al 18, ni tampoco al 4 ni al 17. ^Por qué? Por la misma razón por la que hemos 
desechado las sumas más baja y más alta en el juego anterior. Ahora bien, ^cuál 
es la mejor apuesta? Para responder esta pregunta, tenemos que contar todos los 
resultados específicos (o elementales) posibles que dan lugar a cada una de las 
sumas de la lista anterior. Esto requiere cierto esfuerzo, pero no hay implicado 
ningún principio nuevo, sólo el sentido común y la voluntad de hacer el recuento. 
Hoy tenemos la suerte de disponer de ordenadores que hacen el trabajo por 
nosotros. Los resultados se listan en la tabla siguiente: 


Suma 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 

Multiplicidad 1 3 6 10 15 21 25 27 27 25 21 15 10 6 3 1 

Probabilidad _L^__6_J0 _ì5_^L25_^7_J7_J5_^lì5_J0__6_ _3__L 
216 216 216 216 216 216 216 216 216 216 216 216 216 216 216 216 


En la segunda fila se lista el número de posibilidades para cada suma. Las 








probabilidades se obtienen dividiendo los valores de la segunda fila por 216. 

Así pues, para el caso de un dado la distribución de probabilidad es uniforme. 
Para dos dados, encontramos un máximo en suma = 7 (figura 3.3). Para tres 
dados, tenemos dos probabilidades máximas, cuyo valor es 27/216, 
correspondientes a las sumas 10 y 11. Si queremos ganar, por lo tanto, es mejor 
que apostemos por 10 o por 11. En la figura 3.4 se representa el número de 
sucesos elementales para cada suma posible de los tres dados. Dividiendo este 
número por el número total de sucesos específicos, 6^ = 216, obtenemos las 
probabilidades correspondientes (también representadas en la misma figura). 

E1 lector debería ser capaz de comprobar por sí mismo unos cuantos de estos 
números. No se necesitan matemáticas superiores ni teoría de la probabilidad: 
sólo hay que contar y aplicar el sentido común. Si lo hace así, y entiende por qué 
los valores 10 y 11 tienen una probabilidad máxima, ya está casi a medio camino 
de entender la segunda ley. 

Procedamos ahora a examinar unos cuantos juegos más del mismo tipo, pero 
con un número creciente de dados. 


Cuatro dados y más. 


Si lanzamos cuatro dados, tendremos que elegir un número entre 4 y 24 (la 
mínima y la máxima de las sumas posibles). Como antes, lanzamos los cuatro 
dados simultáneamente y calculamos la suma de puntos, con independencia de la 
identidad (o el color) y del resultado de cada dado concreto; lo único que cuenta 
es la suma. 
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Figura 3.4. 


En este caso tenemos 


1296 resultados específícos posibles. La 




probabilidad de cada resultado específico es 1/1296. E1 recuento en este caso es 
bastante laborioso, pero tampoco hay ningún principio nuevo. La fígura 3.5 
muestra las probabilidades (esto es, el número de resultados específícos para 
cada suma dividido por el total) en función de la suma. Para cuatro dados, el 
rango de sumas posibles va de 4 a 24; para cinco dados, el rango va de 5 a 30; 
para seis dados, el rango va de 6 a 36, y para siete dados el rango va de 7 a 42. 

En la fígura 3.6 se representan las probabilidades en función de la suma 
« reducida» , que no es más que el valor de la suma dividido por el máximo. De 
esta manera se consigue que los diferentes rangos de 0 a N en la figura 3.5 
queden «comprimidos» en un rango único (de 0 a 1). Esta comprensión 
modifica el área bajo la curva. En la figura 3.5, el área bajo cada curva es 1 
mientras que en la fígura 3.6 está reducida por el factor N. Nótese que la 
dispersión de las probabilidades en la figura 3.5 aumenta con N. En la figura 3.6, 
en cambio, la dispersión disminuye con N. Cuanto mayor es N. más se estrecha 
la curva. Si lo que nos interesa son las desviaciones absolutas del máximo (en 
N/2), tenemos que mirar la figura 3.5. Pero si sólo nos interesan las desviaciones 
relativas del máximo (en 1/2) deberíamos acudir a las curvas de la figura 3.6. 
Cuando N se hace muy grande, la curva de la figura 3.6 se vuelve 
extremadamente estrecha, lo que quiere decir que las desviaciones relativas del 
máximo se hacen despreciables. 



Figura 3.5. 





Nótese también que en cada caso hay uno o dos valores cuya probabilidad es 
máxima. Obsérvese la forma de la distribución. Recuerda una campana, también 
conocida como distribución normal o gaussiana. Ésta es una curva importante en 
la teoría de la probabilidad y la estadística, pero no nos incumbe aquí. Nótese 
también que, a medida que aumenta el número de dados, la curva de la figura 
3.6 se estrecha y el pico correspondiente a la probabilidad máxima desciende. E1 
descenso del máximo es el mismo que en la figura 3.5, pero la « dispersión» de 
la curva es diferente. Discutiremos más a fondo este importante aspecto de las 
probabilidades en el capítulo siguiente. Las fíguras 3.7 y 3.8 muestran fíguras 
similares a las de las figuras 3.5 y 3.6, pero para valores de Nmás grandes. 

Detengámonos en este punto para ponderar lo que hemos visto hasta ahora, 
antes de dar el próximo paso. Deberíamos preguntarnos, primero, cuál es el 
número ganador en cada caso y, segundo y más importante, por qué es un 
número ganador. No nos preocupemos de los recuentos exactos; sólo tenemos 
que fijarnos en que en cada juego hay una o dos sumas máximamente 
probables. Esto significa que, si hacemos muchas tiradas, dichas sumas se darán 
con más frecuencia que el resto, así que, puestos a jugar, haríamos bien en 
apostar por estos números ganadores. 





Figura 3.7. 



La primera pregunta es importante, incluso fundamental, si estamos 
interesados en jugar a los dados. Pero si lo que queremos es comprender la 
segunda ley y poder seguir los argumentos de los capítulos que siguen, 
deberíamos concentrarnos en el « por qué» . ^Por qué hay un número ganador? 
Tomemos el caso de tres dados. Pensemos en las razones de la existencia de 
dicho número. Comencemos con suma = 3. Para esta posibilidad sólo hay un 



único resultado específico, que es: 


azul = 1, rojo = 1, blanco = 1... suma = 3 

Uno puede imaginar que este resultado específíco será un suceso muy raro, 
igual que el suceso suma = 18. Como antes, sólo hay un resultado específico para 
obtener 18, que es: 


azul = 6, rojo = 6, blanco = 6... suma = 18 
Para suma = 4 tenemos tres resultados específicos, que son: 
azul = 1, rojo = 1, blanco = 2... suma = 4 
azul = 1, rojo = 2, blanco =1... suma = 4 
azul = 2, rojo = 1, blanco =1... suma = 4 

La partición de suma = 4 en tres enteros es única, 1: 1:2, y si lo único que nos 
importa es que los tres dados sumen 4, no distinguiremos entre los tres casos 
listados. Cada una de las tres posibilidades particulares es una configuración 
específica. Si no diferenciamos entre configuraciones específicas y sólo 
atendemos a la suma = 4, hablaremos de configuración inespecífica o suceso 
inespecífico. 

Para suma = 5 tenemos seis posibilidades específícas: 

azul = 1, rojo = 1, blanco = 3... suma = 5 
azul = 1, rojo = 3, blanco =1... suma = 5 
azul = 3, rojo = 1, blanco = 1... suma = 5 
azul = 1, rojo = 2, blanco = 2... suma = 5 
azul = 2, rojo = 2, blanco =1... suma = 5 
azul = 2, rojo = 1, blanco = 2... suma = 5 

Aquí tenemos dos fuentes de multiplicidad. Primero, hay dos particiones de 
suma = 5 (1:1:3 y 2:2:1) y, segundo, para cada partición hay tres permutaciones 
posibles; en otras palabras, cada partición tiene un peso 3. Diremos que hay seis 
configuraciones específicas, pero sólo un suceso inespecífíco. 

Los conceptos de suceso inespecífico y suceso específíco son importantes 
para comprender la segunda ley. Como hemos visto, cada suceso específíco tiene 
la misma probabilidad. En el juego de dos dados, un suceso específico es una 
constatación de la contribución de cada dado concreto a la suma total. En el caso 
de tres dados, si ignoramos el color de cada dado y su contribución específica a 
la suma total, entonces, para suma = 3, tenemos un suceso inespecífíco 
consistente en un único suceso específico, mientras que para suma = 4 tenemos 
un suceso inespecífico que comprende tres sucesos específicos, y para suma = 5 
tenemos un suceso inespecífico que comprende seis sucesos específícos, y así 



sucesivamente. 

En el capítulo siguiente examinaremos un juego de dados modificado que nos 
llevará aún más cerca del experimento real que discutiremos en el capítulo 7. 
Jugaremos con dados más primitivos, con el número «0» en tres caras y el 
número « 1» en las otras tres. La simplificación que conseguimos es doble. 
Primero, sólo hay dos resultados posibles para cada dado (cero o uno) y, 
segundo, cada suma sólo admite una partición, de manera que el número de 
resultados específicos comprendidos en el suceso suma = n es simplemente n, es 
decir, el número de veces que sale « 1» . 

50 % 



Fin del capítulo 3. 



4 

Jugando con dados siniplificados, y una apreciación 
preliminar de la segunda ley 


E1 nuevo juego es más simple que los anteriores. Consideraremos dados con 
tres caras marcadas con un « 0» y tres caras marcadas con un « 1» , o monedas 
marcadas con un «0» en una cara y un « 1» en la otra. Ya que hemos 
comenzado jugando con dados, continuaremos así, pero si el lector lo prefiere 
puede pensar en monedas. Lo importante es que hacemos un « experimento» 
(lanzar un dado o una moneda) cuyos resultados son «0» o «1», con 
probabilidades 1/2 y 1/2. En vez de seis resultados posibles, ahora tenemos sólo 
dos, lo que constituye una primera simplificación. La segunda simplificación 
viene de la elección de « 0» y «1» como resultados posibles, y es que cuando 
sumamos los resultados de N dados, la suma no es más que el número de unos. 
Los ceros no cuentan. Por ejemplo, con N = 10 (fígura 4.1) podría darse el 
resultado específico 1, 0, 1, 1,0, 1, 0, 1, 0, 0. Aquí la suma es 5, que también es el 
número de unos (o el número total de puntos en los dados con tres caras 
marcadas con un punto y tres sin marca). Nos fijaremos en la « evolución» del 
juego más que en las estrategias ganadoras. Pero, para los que se sientan más 
cómodos jugando, las reglas son las que siguen. Jugamos con N dados insesgados 
cuyos resultados posibles son sólo « 0» y « 1» . Siempre partimos de la misma 
configuración inicial, con todos los dados en cero^] 

Por confíguración entendemos la especificación detallada de la secuencia de 
ceros y unos (por ejemplo, el primer dado muestra un « 1» , el segundo un « 0» , 
el tercero un « 0» , etcétera). Nos referiremos a la configuración inicial como el 
paso cero del juego. Para N= 10, la configuración inicial es: 

00BQ0I0E00 


Figura 4.1. 



0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 


Ahora escogemos un dado al azar, lo lanzamos y lo devolvemos a su lugar. 
Podemos imaginar una máquina que recorre la fila de dados, elige uno al azar y 
le da un toque para hacer que salga « 0» o « 1» con igual probabihdad. También 
podemos programar eljuego en un ordenador^]. 

Con estas reglas simples, seguiremos la evolución de las configuraciones. 
Pero una vez más, para los que Io prefieran así, haremos unas cuantas jugadas. 
Comencemos por escoger un número entre 0 y 10; digamos que el lector elige el 
4 y yo el 6. Partimos de la configuración de todo ceros y procedemos según las 
reglas. A cada paso calculamos la suma: si el resultado es 4, el lector contabiliza 
un punto; si es 6, el punto es para mí. iQué suma deberíamos elegir? Se podría 
pensar que una opción obvia es suma = 0, ya que, al conocerse la confíguración 
inicial, es una apuesta segura en el paso cero. Esto es verdad, pero $ si 
convenimos de entrada en jugar un millón de pasos? 

Pasemos a examinar con detenimiento y paciencia la evolución de este juego 
al cabo de muchos pasos. Uno debería entretenerse en este ejercicio aunque sólo 
le interesara saber cuál es la mejor apuesta, pero seguir la evolución del juego es 
crucial para comprender la segunda ley de la termodinámica. Hay que estar 
atento y alerta, y concentrarse en qué ocurre y por qué ocurre. En cuanto al 
cómo ocurre, ya hemos descrito el« mecanismo» . 

Recordemos que estamos jugando con reglas nuevas. Los dados darán sólo 
dos resultados posibles, « 0» y « 1» . En consecuencia, la suma de los resultados 
de Adados sólo puede variar entre 0 (todo ceros) y A(todo unos). Además, sólo 
hay una partición de cada suma, lo que representa una gran simplificación en 
comparación con el juego anterior con dados clásicos, donde teníamos que 
considerar distintos pesos para las distintas particiones, una tarea que se complica 
a medida que aumenta N (véanse los capítulos 2 y 3). Aquí sólo tenemos que 
preocuparnos del peso de una partición. Por ejemplo, para N= 4 y suma = 2, sólo 
hay una partición de 2 en dos ceros y dos unos. Las posibilidades son: 

0011 0101 0110 1001 1010 1100 

Hay seis configuraciones específícas esto es, seis secuencias ordenadas de 
ceros y unos para el suceso inespecífico suma = 2. Por suceso inespecífico 
entendemos el número de unos que han salido, con independencia de sus 
localizaciones específicas en la secuencia. Para cualquier suceso inespecífico, 
que podemos denotar como suma = n, hay distintas ordenaciones de los ceros y 
unos, cada una de las cuales determina una configuración específica, o suceso 


específico. Antes de proceder con los nuevos juegos, fijémonos de nuevo en las 
figuras 3.5 y 3.6 (o 3.7 y 3.8). Estas figuras representan las probabilidades en 
función de la suma y en función de la suma reducida (es decir, el valor de la 
suma dividido por N). Nótese que todas las curvas tienen un máximo en N/2 (o en 
1/2, en el caso de la suma reducida). Cuanto mayor es N, más bajo es el pico del 
máximo. 


Dos dados; N = 2. 


Como en el caso anterior, el juego con un dado no tiene nada de interesante, 
así que comenzaremos analizando el caso de dos dados. 

Recordemos que en el presente juego partimos de una configuración inicial 
específica, que en lo sucesivo siempre será la de todo ceros. Ya sabemos que la 
opción ,sM/wcr = 0 es una apuesta segura en el paso cero. Pero supongamos que 
decidimos apostar por suma = 2, el resultado más alto posible de este juego. 
Recordemos que cuando jugábamos con dos dados reales, el mínimo, suma = 2, 
y el máximo, suma = 12, tenían la misma probabilidad 1/36. Aquí las reglas del 
juego son diferentes. Si mi oponente apuesta por suma = 0 y yo apuesto por suma 
= 2, su probabilidad de ganar en el paso cero es 1, y la mía es 0, así que suma = 0 
es la mejor apuesta en el paso cero. en el paso uno? Ahora mi oponente 
ganará si al lanzar el dado elegido al azar sale cero. La probabilidad de que esto 
ocurra es 1/2. En cuanto a mí, no hay manera de obtener suma = 2 en el prhner 
paso, ya que los dos únicos resultados posibles son cero y uno, así que mi 
probabilidad de ganar es nula. Así pues, mi oponente ha elegido mejor en los 
pasos cero y uno. 

Demos un paso más. Es fácil ver que mi oponente sigue teniendo ventaja. 
Para que yo gane, la suma debe aumentar de cero a uno en el primer paso, y de 
uno a dos en el segundo. Mi oponente tiene más vias para obtener suma = 0 en el 
segundo paso: puede ser que vuelva a salir cero en el primer paso y en el 
segundo paso, o que salga un uno en el primer paso y vuelva a salir cero en el 
segundo paso. 

La figura 4.2 muestra dos manos de este juego^9], C ada una de cien pasos. 
Es evidente que, después de muchos pasos, el número de « visitas» a suma = 0 y 
suma = 2 será más o menos el mismo, aunque hayamos partido de suma = 0. Se 
dice que el juego pierde su « memoria» de la configuración inicial. E1 resultado 
neto es que a mi oponente sólo le va un poco mejor que a mí en este juego. 

si, en vezde apostar por suma = 2, apuesto por suma = 1, mientras que mi 


oponente sigue apostando por suma = 02 Como antes, él tiene todas las de ganar 
en el paso cero. En el paso siguiente, ambos tenemos la misma probabilidad de 
ganar, 1/2. Pero si observamos la « evolución» del juego, al cabo de muchos 
pasos el juego visitará suma = 0 con bastante menos frecuencia que suma 1. Así 
pues, es evidente que, a la larga, yo saldré ganando a pesar de la victoria 
garantìzada de mi oponente en el paso cero. 
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Figura 4.2. 


Dejemos de jugar por un momento y fyémonos en la evolución del juego tal 
como se muestra en la figura 4.2. Nótese que en ambas manos hemos partido de 
suma = 0, es decir, de la configuración {0,0}. Vemos que en la primera mano el 
primer paso se mantiene en suma = 0, mientras que en la segunda mano pasamos 
de cero a uno. A la larga acabaremos habiendo visitado suma = 0 un 25% de las 
veces, suma = 2 otro 25% de las veces, y suma = 1 un 50% de las veces. La razón 
es la misma que en el caso del juego con dos dados reales del capítulo anterior: 
hay una configuración específica para suma = 0, una configuración específica 
para suma = 2, y dos configuraciones específicas para suma = 1, tal como se 
indica en la tabla de abajo. 







Configuración 

{0,0} {1,0} {0,1} {1,1} 

Peso 

1 

2 

1 

Probabilidad 

1/4 

2/4 

1/4 


Esto es fácil de entender y comprobar experimentando físicamente con 
dados (o monedas) o mediante una simulación por ordenador. 

En la figura 4.2 podemos ver y contar el número de visitas a cada nivel. 
Vemos que la ligera ventaja de la apuesta por suma = 0 acaba disipándose. 

Antes de pasar al juego con cuatro dados, adviértase que nada de lo que 
hemos aprendido hasta aquí parece relevante para la comprensión de la segunda 
ley. Lo hemos presentado sobre todo como entrenamiento en el análisis (no 
matemático) de la evolución del juego, y como preparación para ver cómo y 
por qué aparecen nuevas propiedades cuando el número de dados se agranda. 
Estas nuevas propiedades no sólo son relevantes, sino que son la esencia misma 
de la segunda ley de la termodinámica. 

Si simulamos muchos juegos como éste en un ordenador, podríamos 
encontrar ciertas «estructuras» en algunas manos, como por ejemplo una 
secuencia de diez ceros consecutivos, o una alternancia de ceros y unos, o 
cualquier otra estructura específica que se nos ocurra. Cada «estructura» 
específica (es decir, una secuencia de resultados concreta) es posible, y si 
jugamos muchas veces aparecerán de vez en cuando. Por ejemplo, la 
probabilidad de observar el suceso suma = 0 en los 100 pasos es simplemente 
(1 /2) 100, es rnenos de una de cada 10^ manos. 


Cuatro dados; N = 4. 


Procedamos a jugar con cuatro dados. Esta modalidad tiene características 
algo diferentes. Una vez más, partimos de una confíguración de todo ceros en el 
paso cero, elegimos un dado al azar, lo lanzamos y lo volvemos a colocar en su 
sitio con el resultado que ha salido. La figura 4.3 muestra dos manos de este 
juego. Cada mano consta de 100 pasos. Se representa la suma en función del 
número de pasos. E1 valor mínimo es suma = 0 (todo ceros) y el máximo es suma 
= 4 (todo unos). 

Si el lector quiere apostar por suma = 0 y mantener esta apuesta (como 







establecen las reglas del juego), ganará si yo apuesto por el 4. La razón es la 
misma que antes. Como hemos partido de la configuración de todo ceros, el 
juego está ligeramente « sesgado» hacia suma = 0. Si elijo suma = 2, es seguro 
que perderé en el paso cero y que mi oponente ganará. También tendrá ventaja 
en los pasos sucesivos, pero su ventaja inicial se disipará a la larga. Podemos ver 
que, al cabo de 100 pasos, el promedio de visitas de cada resultado posible es: 

suma= 0 en 1/16 de los pasos 
suma= 1 en 4/16 de los pasos 
suma= 2 en 6/16 de los pasos 
suma= 3 en 4/16 de los pasos 
suma= 4 en 1/16 de los pasos 

Estos promedios son a largo plazo, y pueden calcularse con exactitud. Como 
puede verse, la ligera ventaja inicial de la apuesta por suma = 0 se esfuma. 
Examinemos con más detalle las manos de este juego (figura 4.3) y 
comparémoslo con el caso de dos dados (figura 4.2). 




Figura 4.3. 


Una característica obvia de este juego es que el número total de visitas a la 
configuración inicial (suma = 0) es más bajo que antes. Examinemos todas las 




configuraciones posibles: 


Suceso inespecífico 

Sucesos específicos 


suma = 0 

suma = 1 

0,0,0,0 

1,0,0,0 0,1,0,0 0,0,1,0 

0,0,0,1 

suma = 2 

1,1,0,0 1,0,1,0 1,0,0,1 0,1,1,0 

0,1,0,1 0,0,1,1 

suma = 3 

1,1,1,0 1,1,0,1 1,0,1,1 

0,1,1,1 

suma = 4 

1,1,1,1 



En total hay 16 configuraciones específicas. Las hemos clasificado en cinco 
grupos, cada uno caracterizado únicamente por la suma de los resultados de cada 
dado, o el « número de unos» , con independencia de la posición de los « unos» 
en la secuencia. Así, hemos pasado de 16 configuraciones específicas (es decir, 
donde se especifican las posiciones de todos los ceros y unos) a cinco 
configuraciones inespecíficas (donde sólo cuenta el número de « unos»). La 
distinción entre configuraciones específicas y configuraciones inespecíficas es 
muy importante^O]. Una configuración inespecífica incluye una o más 
configuraciones específicas. 

Otra característica común a ambos juegos (y a los que nos quedan en este 
capítulo) es que, a pesar del leve sesgo inicial favorable a suma = 0 en 
comparación con suma = 4, a la larga (o muy a la larga) veremos que, en 
promedio, la suma fluctuará en torno a la línea de puntos que hemos trazado a la 
altura de suma = 2. Esta tendencia se hará más pronunciada y clara a medida 
que aumente N. 

Antes de pasar al juego siguiente, el lector debería « entrenarse» con este 
juego, bien jugando con dados reales, bien simulándolo en un PC. Debería 
recurrir sólo a su sentido común para comprender por qué el número de visitas a 
la configuración inicial decrece a medida que aumenta el número de pasos, y 
por qué el número de visitas a suma = 2 es el mayor a largo plazo. 


Diez dados; N =10. 


Con diezdados apreciaremos algo nuevo, que se hará más evidente a medida 
que aumentemos el número de dados, hasta que lleguemos a identificar un 
comportamiento similar a lo que dicta la segunda ley. 

Comenzaremos como antes, con una configuración de todo ceros, de manera 





que la suma de puntos es nula. La figura 4.4 muestra dos manos de este j uego. 

En el primer paso podemos quedarnos en suma = 0 o pasar a suma = 1. La 
probabilidad de ambas posibilidades es 1/2. Esto apenas se aprecia a la escala de 
la figura 4.4. Pero lo importante es lo que ocurre a continuación. Como puede 
verse en las manos representadas en la figura, la tendencia general en los 
primeros pasos es ascendente. ^Por qué? La respuesta es muy simple. Tras el 
primer paso, tenemos una de dos configuraciones posibles: o todo ceros, o nueve 
ceros y un uno. Ahora elegimos un dado al azar. Obviamente, es mucho más 
probable que el dado seleccionado corresponda a un cero. Si es así, podemos 
subir o quedarnos como estábamos, pero no bajar. Para que ocurra esto último 
tenemos que seleccionar el único dado con un « 1» (lo cual es relativamente 
poco probable) y convertirlo en « 0» (con probabilidad 1/2). Así, un descenso de 
la suma en el segundo paso es un suceso raro (y lo será cada vez más a medida 
que aumente N). Si examinamos detenidamente este razonamiento, nos 
convenceremos de que, al dar el segundo paso, es mucho más probable subir que 
bajar. Es importante entender bien este comportamiento en esta fase, porque 
luego aumentaremos el número de dados. La razón por la que nos 
entretendremos en hacer cálculos con diez dados para luego extrapolarlos a un 
número creciente de dados es que el caso de diezdados es bastante simple. Para 
un número mayor de dados los cálculos podrían intimidar a los lectores y 
hacerles desistir del análisis probabilístico. 
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Figura 4.4. 










E1 juego con diez dados es muy simple. Como siempre, partimos de una 
configuración de todo ceros. Por lo tanto, en el primer paso elegiremos un « 0» 
con probabilidad 1, y luego podemos ascender ( suma = 1) con probabilidad 1/2 o 
quedarnos como estamos ( suma = 0) con la misma probabilidad. No hay 
descenso posible. 

En el segundo paso el razonamiento es algo más complicado. Si tras el primer 
paso estamos en suma = 0, entonces las dos posibilidades son las mismas que 
antes. Pero si tras el primer paso nos hemos situado en suma = 1, entonces 
tenemos cuatro posibilidades: 

1) Seleccionar al azar un « 1» con probabilidad 1/10 y quedarse 
como antes con probabilidad 1/2. 

2) Seleccionar al azar un « 1» con probabilidad 1/10 y bajar con 
probabilidad 1/2. 

3) Seleccionar al azar un «0» con probabilidad 9/10 y subir con 
probabilidad 1/2. 

3) Seleccionar al azar un «0» con probabilidad 9/10 y quedarse 
como antes con probabilidad 1/2. 

Las probabilidades netas de las cuatro posibilidades son: 

1) 1/10 veces 1/2 = 1/20 de quedarse como antes ( suma = 1) 

2) 1/10 veces 1/2 = 1/20 de bajar {suma = 0) 

3) 9/10 veces 1/2 = 9/20 de subir ( suma = 2) 

4) 9/10 veces 112 = 9/20 de quedarse como antes (suma = 1). 

Ni que decir tiene que quedarse en suma = 1 o subir es mucho más probable 
que volver a cero. Esto se refleja en la tendencia general ascendente al principio 
de ambas manos, tal como se aprecia en la figura 4.4. 

En el tercer paso podemos hacer el mismo cálculo. La tendencia a subir sigue 
siendo significativa, aunque no tanto como antes. ^Por qué? Porque para subir 
tenemos que seleccionar un «0» con una probabilidad máxima de 8/10 
(suponiendo que estemos en suma = 2) y subir con probabilidad 1/2. La 
probabilidad de subir sigue siendo mayor que la de bajar, pero es algo menor que 
en el segundo paso. E1 razonamiento es el mismo para los pasos cuarto, quinto, 
etcétera. Acada paso, la probabilidad de subir disminuye, hasta que alcanzamos 
el nivel suma = 5. Aquí volvemos a tener cuatro posibilidades: 

1) Seleccionar al azar un « 1» con probabilidad 1/2 y quedarse 
como antes con probabilidad 1/2. 

2) Seleccionar al azar un « 1» con probabilidad 1/2 y bajar con 



probabilidad 1/2. 

3) Seleccionar al azar un « 0» con probabilidad 1/2 y subir con 
probabilidad 1/2. 

4) Seleccionar al azar un « 0» con probabilidad 1/2 y quedarse 
como antes con probabilidad 1/2. 

Las probabilidades netas de estas cuatro posibilidades son: 

1) 1/2 veces 1/2 = 1/4 de quedarse como antes ( suma = 5) 

2) 1/2 veces 1/2 = 1/4 de bajar ( suma = 4) 

3) 1/2 veces 1/2 = 1/4 de subir ( suma = 6) 

4) 1/2 veces 1/2 = 1/4 de quedarse como antes (suma = 5). 

Lo importante aquí es que, cuando alcanzamos el nivel suma = 5, tenemos la 
misma probabilidad de subir que de bajar, 1/4, y tenemos una probabilidad doble, 
1/2, de quedarnos en suma = 5. 

Cuando alcanzamos el nivel suma = 5, las posibilidades de subir y de bajar se 
vuelven simétricas. Podemos decir que, en esta fase, el sistema ha « olvidado» 
su configuración inicial. Si partimos de cualquier configuración inicial por debajo 
de suma = 5, al principio habrá una tendencia mayor a subir que a bajar. Por otro 
lado, si partimos de una configuración situada por encima de suma = 5, la 
tendencia será descendente. Si partimos de suma = 5, o llegamos ahí a lo largo de 
la mano, lo más probable es seguir en ese nivel. Como veremos, este argumento 
es válido en todos los casos, pero se hace más poderoso cuanto mayor es el 
número de dados. Por esta razón nos referiremos a dicho nivel ( suma = 5 en el 
caso particular de diez dados) como nivel de equilibrio. De hecho, la naturaleza 
misma de este nivel le lleva al equihbrio, con pesos iguales para las 
probabilidades de subir o bajar, pero mayor probabilidad de quedarse como 
antes. En las figuras, el nivel de equilibrio correspondiente se indica mediante una 
línea de puntos. Es un equilibrio también en el sentido de que el sistema tiende a 
recuperarse de cualquier desviación de la línea, por arriba o por abajo. Podemos 
pensar en una « fuerza» imaginaria que devuelve el sistema a su nivel de 
equilibrio. Cuanto más nos apartemos de la línea de equilibrio, más intensa será la 
« fuerza» restauradora del mismo. 

Las dos características antes descritas (la tendencia inicial a alcanzar un nivel 
de equilibrio y, una vez alcanzado éste, la tendencia a mantenerse en él) son las 
semillas de la segunda ley. En sentido figurado, podemos imaginar una suerte de 
fuerza fantasmal que atrae cualquier configuración específica hacia la línea de 
equilibrio. Una vez allí, cualquier desviación de la línea de equihbrio es 
« forzada» a regresar^^. Dicho de otra manera, podemos concebir la línea de 


equilibrio como un atractor, siempre tirando de la « suma» hacia él. 

Por eso es muy poco probable que observemos grandes desviaciones de la 
línea de equilibrio. De ahí que sólo muy raramente hayamos presenciado una 
reversión a la configuración original, o que se alcance el valor máximo suma = 1. 
(Es fácil calcular que una visita a estos extremos tiene una probabilidad de 1/2*0, 
que viene a ser un paso de cada 1000). 

Como en el caso de cuatro dados, podríamos haber listado todas las 
configuraciones específicas posibles de los diez dados. En la tabla de abajo sólo 
hemos listado unas pocas configuraciones correspondientes a cada estado 
inespecífico. 


Suceso 

inespecífico 

Ejemplos 
de sucesos 
específicos 

Número de sucesos 
específicos 
comprendidos en 
el suceso inespecífco 

0 

0000000000 

1 

1 

0000000001,0000000010,... 

10 

2 

0000000001,0000000010,... 

45 

3 

0000000001,0000000010,... 

120 

4 

0000000001,0000000010,... 

210 

5 

0000000001,0000000010,... 

252 

10 

1111111111 

1 


Hemos agrupado las 2*0 = 1024 configuraciones específicas en 11 grupos; 
cada grupo es una configuración inespecifica (o estado, o suceso, inespecífico). 
Inespecífico-1 (esto es, todas las configuraciones que contienen un solo « 1») 
tiene diez configuraciones específicas, mientras que inespecífico-5 tiene 252 
configuraciones específicas. 

Aunque el aspecto de juego de apuestas de este experimento no es lo que más 
debe interesarnos, puede que el lector haya tomado nota de que si apuesta por 
suma = 0 y yo lo hago por suma = 5, es seguro que ganará en el paso cero, 
mientras que en el primer paso ganará con probabilidad 1/2, y a partir de ahí su 
probabilidad de ganar declina rápidamente. Por otro lado, mi probabilidad de 
ganar en los primeros pasos es nula, pero una vez alcanzado el nivel suma = 5, 
mis posibilidades de ganar son 252:1. 








Volvamos a examinar la evolución de los dos casos siguientes antes de poner 
plenamente de manifiesto el comportamiento característico de la entropía. 
También cambiaremos nuestra nomenclatura. En vez de hablar del nivel suma = 
k, diremos simplemente inespecífico-k En realidad, la suma no es lo importante. 
Lo que importa es cuántos unos, o puntos, hay en cada configuración 
inespecífíca, o suceso inespecífico. 


Cien dados; N = 100. 


En la figura 4.5 se muestran dos manos de 1000 pasos, en cada uno de los 
cuales se lanzaron cien dados. Evidentemente, cuanto mayor es el número de 
dados más pasos se requieren para ir de 0 al nivel de equilibrio, que en este caso 
es 50. ^Cuánto tardaremos en alcanzar el nivel de equilibrio? Si somos 
inmensamente afortunados y a cada paso nos toca cambiar un « 0» por un « 1» , 
entonces necesitaremos un mínimo de 50 pasos para llegar a 50^2]. p e ro no 
siempre nos tocará lanzar un dado con « 0» , y cuando así sea, la probabilidad de 
convertirlo en « 1» es sólo 1/2, de manera que, en la práctica, el ascenso hacia el 
nivel de equilibrio será más lento. Lo normal es que se necesiten de 200 a 400 
pasos. Como se aprecia en la figura, la ascensión es bastante constante, con 
algunos descansos al mismo nivel y pequenos descensos ocasionales, para luego 
seguir subiendo. 

Cuando hayamos accedido al nivel 50, nos quedaremos en él o en su 
vecindad la mayor parte del tiempo. Ocasionalmente nos desviaremos bastante 
del nivel de equilibrio. En las manos representadas nunca se volvió a visitar el 
nivel inicial 0, pero esto no implica que tal cosa sea imposible. La probabihdad de 

que ocurra es 1/2^®, o un paso de cada 10^. (Éste es un número enorme, 
aunque no tanto como para no poder escribirlo explícitamente: 
1 000 000 000 000 000 000 000 000 000 000. Pero es muy pequeno en 
comparación con los números que nos esperan, unos números que nunca 
podríamos escribir explícitamente). En otras palabras, las posibilidades de visitar 
el nivel 0 (o 100, el máximo posible) no llegan a uno de cada quintillón de pasos. 
Este experimento no debe intentarse con dados reales, pues sería insufriblemente 
largo, arduo y tedioso. Es más fácil simularlo con un ordenador. 


Mildados; N= 1000. 


Los resultados de este caso se parecen mucho a los anteriores, pero, a la 
escala de la figura 4.6, la curva es menos sinuosa. Para alcanzar el nivel de 
equiiibrio necesitamos de 3000 a 4000 pasos. Una vez allí, las desviaciones 
apenas se apartan de la línea de equilibrio. Las desviaciones mayores son raras 
(pueden verse como picos y muescas a lo largo de la línea de equilibrio) y, por 
supuesto, las desviaciones lo bastante importantes para alcanzar el nivel cero no 
se observan « nunca» . No es que sea un suceso imposible, pero sólo se daría a 
una tasa de uno de cada 10*^ pasos (un uno seguido de trescientos ceros). 
Aunque ejecutemos el programa de ordenador durante mucho tiempo, lo más 
probable es que no lleguemos a observarlo. 

Recordemos nuestros cálculos de la probabilidad de subir, de bajar o de 
quedarse en el mismo nivel. Aunque los cálculos son los mismos, es instructivo 
hacerse una idea de cómo cambian las tendencias con el número de dados. 



Número de pasos 
Figura 4.5. 


En el primer paso tenemos la misma probabilidad de subir que de quedarnos 
en el nivel cero. Si subimos al nivel uno, entonces hay cuatro posibilidades para el 
segundo paso: 

1) Seleccionar al azar un « 1» con probabilidad 1/1000 y quedarse 
como antes con probabilidad 1/2. 

2) Seleccionar al azar un « 1» con probabilidad 1/1000 y bajar con 
probabilidad 1/2. 










3) Seleccionar al azar un «0» con probabilidad 999/1000 y subir 
con probabilidad 1/2. 

4) Seleccionar al azar un «0» con probabilidad 999/1000 y 
quedarse como antes con probabilidad 1/2. 


Así pues, las probabilidades de las tres posibilidades netas para el siguiente 
paso son: 


1) 1/1000 veces 1/2 + 999/1000 veces 1/2 = 1/2 de quedarse en el 
mismo nivel 

2) 999/1000 veces 1/2 = 999/2000 de subir 

3) 1/1000 veces 1/2 = 1/2000 de baj ar. 


1000 

cc 800 
E 600 
cZ) 400 
200 


2000 4000 6000 8000 10000 

Número de pasos 



1000 
800 
co 600 
| 400 
CO 200 


Segunda mano con 1000 dados 



2000 4000 6000 8000 10000 


Número de pasos 


Figura 4.6. 


Vemos que la probabilidad de quedarse en el mismo nivel es la más alta 
(probabilidad: 1/2), aunque es casi igual que la probabilidad de subir (999/2000), 
mientras que la probabilidad de bajar es muy pequena (1/2000). 

Es un comportamiento muy notable, y debemos examinar estas cifras 
detenidamente. Compárese este caso con el de N = 10, y piénsese en lo que 

ocurrirá si N aumenta a 10^, 10^ y más allá. Comprender este juego es crucial 
para entender el comportamiento de la entropía. 

Podemos repetir los mismos cálculos para los pasos tercero, cuarto, etcétera. 
Cuantos más ceros haya en las configuraciones, mayor será la probabilidad de 
subir y menor la de bajar. La « fuerza» de este argumento se debilita a medida 










que la suma se acerca al nivel N /2 = 500. Esto se refleja en la forma general de 
las curvas de la figura 4.6. La pendiente inicial de la curva es marcada, y luego 
se hace cada vez más horizontal a medida que nos acercamos a la línea de 
equilibrio. Una vez alcanzado ese nivel, tenemos una probabilidad mayor de 
quedarnos en él, e iguales probabilidades de subir y de bajar. Como en los casos 
anteriores, siempre que el sistema se desvíe de la línea de equilibrio, mostrará 
una tendencia a regresar a esa línea, como si una « fuerza» invisible tirara de la 
curva hacia la línea de equilibrio. 


Diez mil dados; N = 


lûft y más allá. 


La figura 4.7 muestra una mano con N = 10^. No hay necesidad de 
representar más manos, ya que todas las gráficas son casi idénticas. Como 
podemos ver, la curva es muy lisa a esta escala; incluso las pequenas 
irregularidades que observábamos en el caso anterior han desaparecido. Esto no 
significa que no haya fluctuaciones, sino que, a la escala de esta gráfica, no se 
aprecian. Podemos visualizarlas si amplificamos la curva en un intervalo corto de 
pasos, tal como hemos hecho en los dos paneles de debajo. 

Como puede verse, cuando alcanzamos la línea de equilibrio (lo que ocurre 
tras un número bastante grande de pasos), nos quedamos en ella o su vecindad 
casi permanentemente. La curva de los resultados de nuestra simulación y la 
línea de equilibrio se funden. No vemos fluctuaciones llamativas, y mucho 
menos que se visite la configuración inicial. Pero la probabilidad de dicho suceso 
sigue siendo no nula. Es tan pequena como (1/2)^ ®00, lo que viene a ser un paso 
de cada 10^00 (un uno seguido de tres mil ceros; que nadie intente escribirlo 
explícitamente). Esto significa que, en la práctica, «nunca» observaremos 
ninguna visita a la configuración inicial, y una vez alcancemos la línea de 
equiiibrio nos quedaremos en su vecindad « siempre» . He entrecomillado las 
palabras «nunca» y « siempre» para insistir en que éstos no son términos 
absolutos, y que existe una posibilidad remota de visitar la configuración inicial 
« de vez en cuando» . Esta posibilidad ya era muy remota para N = 1000, y 
como veremos en el capítulo 7, cuando tratamos con sistemas reales manejamos 
números del orden de N= ÌO^, que es muchos órdenes de magnitud mayor que 
N= 1000. Para un sistema así, la probabilidad de volver a visitar la configuración 
de partida es tan minúscula que de hecho podemos emplear las palabras 
« nunca» y « siempre» sincomillas. 

Para que el lector se haga una idea de lo que significa este número, 



supongamos que practicamos nuestro juego de dados a razón de mil pasos por 
segundo. O si el lector cree que puede ir aún más deprisa, tomemos un millón de 
pasos por segundo. En la actualidad se estima que la edad del universo es del 
orden de 15 000 millones de anos. Así pues, si efectuáramos un millón de pasos 
por segundo, en ese tiempo completaríamos 

10 6 X 60 X 60 X 24 X 365 X 15 X 109 -= 4 X 10 16 pasos 
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Figura 4.7. 


Es decir, desde que existe el universo habríamos dado unos 
10 000 000 000 000 000 pasos, lo que significa que no habríamos visitado la 
configuración inicial ni una vez. Para observar tal cosa tendríamos que jugar 
durante un tiempo mil millones de veces mayor que la edad del universo. Así, 
aunque hemos admitido que « nunca» no es un término absoluto, prácticamente 
lo es. Meditemos por un momento lo que significa realmente un «nunca» o un 
« siempre» en sentido absoluto. 










En la vida diaria usamos estos términos sin pensar. Cuando uno le promete a 
su mujer que « siempre» le será fiel, no lo dice en sentido absoluto. Como 
mucho, está dando a entender que en los próximos cien anos «nunca» la 
enganará con otra. 

i,Y qué hay de la afirmación de que el sol « siempre» saldrá cada manana? 
^Podemos estar seguros de que será así « siempre» en sentido absoluto? Todo lo 
que sabemos es que en los últimos millones de anos ha venido ocurriendo así, y 
podemos predecir (o, mejor, adivinar) que el sol seguirá saliendo por la manana 
en los próximos millones, o miles de millones, de aiios. Ahora bien, ^podemos 
decir « siempre» en sentido absoluto? jDesde luego que no! 

i,Y qué podemos decir de las leyes de la naturaleza? ^Se puede afírmar que la 
ley de la gravedad o la velocidad de la luz permanecerán «siempre» 
invariantes? Tampoco podemos asegurarlo^]. Todo lo que podemos decir es 
que es probable que así sea durante los próximos 15 000 millones de anos. 

De ningún aspecto del mundo físico se puede afirmar que « siempre» será 
así, o que «nunca» dejará de serlo, en sentido absoluto. Puede que estos 
términos puedan aplicarse en el mundo platónico de las ideas. En ese mundo sí 
podemos hacer afirmaciones del estilo de «la razón entre la longitud de la 
circunferencia y el radio de un círculo nunca se desviará de 271» . 

Hemos entrecomillado los términos «nunca» y « siempre» para significar 
que no tienen un sentido absoluto. También hemos visto que en el mundo físico 
nunca podemos estar seguros de poder emplear las palabras «nunca» y 
« siempre» en sentido absoluto (el primer « nunca» en la frase anterior es más 
absoluto que el segundo). Pero hemos visto que la afirmación de permanecer 
« siempre» en la línea de equilibrio o su vecindad, y no regresar « nunca» al 
estado inicial, puede hacerse con toda confíanza. En el contexto de la segunda 
ley, podemos afirmar que, cuando decimos « nunca» , es el « más nunca de los 
nuncas» que podamos imaginar, y que cuando decimos «siempre» en el 
equilibrio, es el « más siempre de los siempres» . 

Así pues, en adelante mantendremos las comillas de « nunca» y « siempre» 
para tener presente que no son términos absolutos, pero también los pondremos 
en negrita para remarcar que, en el contexto de la segunda ley, están todo lo 
cerca del sentido absoluto que puede estar un enunciado sobre el mundo físico. 

Espero que el lector me haya seguido hasta aquí. Si no, debería repasar los 
razonamientos para los casos con un número pequeno de dados. En todos los 
juegos de este capítulo debería hacerse tres preguntas: 

1) iQué es lo que cambia a cada paso? Pruebe a darle un nombre 
que refleje lo registrado en cualquiera de esos juegos. 

2) ^Cómo tiene lugar el cambio? Ésta es la pregunta más fácil. Y lo 
más importante. 


3) iPor qué el cambio siempre progresa hacia la línea de 
equilibrio, y por qué el sistema «nunca» vuelve a la 
configuración inicial y se queda « siempre» en la vecindad de 
la línea de equilibrio? 

Si el lector no tiene dificultades con estas preguntas y considera que puede 
darles una respuesta razonada, ya está a medio camino de entender la segunda 
ley de la termodinámica. 

Todavía nos queda una pregunta más importante por responder. ^Qué tienen 
que ver todos estos juegos de dados con un experimento físico real, y hasta qué 
punto lo que hemos visto tiene relevancia para la segunda ley? Volveremos a esta 
cuestión en el capítulo 7, pero antes nos tomaremos un respiro. 

Supongo que el lector ha tenido que esforzarse un tanto para seguirme hasta 
aquí. Es momento de relajarse y experimentar más pasivamente la segunda ley 
(o, mejor, algunas analogías de la segunda ley) con nuestros sentidos. Lo que 
haremos en el capítulo siguiente es simplemente imaginar distintas experiencias 
que, en principio, podríamos percibir con nuestros sentidos. Esto debería damos 
una idea de la variedad de procesos posibles con las mismas reglas de juego. 
También nos preparará para apreciar mejor la inmensidad de procesos 
gobernados por la segunda ley. No hará falta hacer ningún cálculo; sólo meditar 
sobre por qué los procesos que estamos experimentando ocurren como ocurren. 
Tras este receso retomaremos un análisis más profundo, y traduciremos todo lo 
que hemos aprendido con el lenguaje de los dados al lenguaje de los sistemas 
reales constituidos por átomos y moléculas. En el capítulo 6 intentaremos 
comprender la segunda ley dentro del mundo de los dados, y en el capítulo 7 
traduciremos este conocimiento al Ienguaje de los experimentos reales. 

50 % 





Fin del capítulo 4. 



5 

Cómo experimentar la segunda ley con los cinco 
sentidos 


En este capítulo no aprenderemos nada nuevo de los juegos de dados, ni 
adquiriremos ninguna nueva intuición de la naturaleza de la segunda ley de la 
termodinámica. En vez de eso, describiremos unos cuantos experimentos 
hipotéticos. Tras todos esos procesos subyace un principio básico que, como 
veremos, es relevante para la segunda ley. También haremos uso de diversos 
sentidos para percibir la segunda ley. Todos los procesos que veremos son 
manifestaciones diferentes del mismo principio y representan el inmenso 
número de manifestaciones posibles de la segunda ley. Para no aburrir al lector 
con repeticiones, modificaremos un poco las reglas del juego. Esto lo hacemos 
para mostrar que las reglas no tienen por qué ser rígidas. Por ejemplo, no 
tenemos por qué lanzar un solo dado a cada paso, sino que podemos lanzar dos, 
tres, cuatro o todos a la vez También podemos lanzar los dados por orden y no al 
azar, o seleccionar un dado al azar pero hacerlo cambiar de manera determinista 
(de « 0» a « 1» o de « 1» a « 0», por ejemplo). Lo que importa es que cada 
dado tenga las mismas oportunidades de cambiar, y que haya un elemento de 
aleatoriedad en el proceso. Volveremos a analizar en profundidad el mecanismo 
del cambio en el capítulo 7, pero ahora disfrutemos de algunos experimentos 
hipotéticos. Están pensados para ser entretenidos y enriquecer nuestra 
experiencia y familiaridad con la segunda ley. No hace falta esforzarse en 
entender los procesos descritos. Volveremos a ocuparnos de la comprensión en el 
capítulo siguiente, y de la relevancia de estos modelos para el mundo real en el 
capítulo 7. Por ahora, el lector puede limitarse a leer y a gozar de la 
« experiencia» . 


Con la visión. 


Comenzaremos con el caso más simple. No cambian las reglas dadas en el 



capítulo 4, ni el número de resultados posibles, ni sus probabilidades. La única 
diferencia es que, en vez de contar el número de unos (o sumar los puntos de 
todos los dados), vamos a ver cómo cambia el matiz de un sistema con el tiempo, 
o con el número de pasos. 

Supongamos que tenemos jVdados, cada uno con tres caras de color blanco y 
tres de color negro. También podríamos pensar en monedas con una cara blanca 
y otra negra, pero continuaremos recurriendo a la metáfora de los dados. 



Figura 5.1. 


Una configuración específíca de los /Vdados será una especificación del color 
de la cara superior de cada dado. En este experimento concreto no hay « suma» 
de resultados contabilizabas. Aquí los resultados son colores y no números^] 
En el caso de los dados numerados, hemos definido una confíguración 
inespecífica como el conjunto de todas las configuraciones específicas con la 
misma suma o, equivalentemente, el mismo número de unos. Con dados 
coloreados, para proceder de la configuración específica a la inespecífica 
podemos imaginar que cada dado es un píxel de una imagen digital. Hay píxeles 
de dos colores, y tan pequenos que sólo vemos un color « promedio» . En la 





figura 5.1 se muestran unos pocos sucesos inespecíficos. En el borde izquierdo 
tenemos un 100% de blanco, y vamos anadiendo un 10% de gris a cada franja 
sucesiva, hasta llegar a un 100% de negro en el borde derecho. 

En todos los ejemplos de este capítulo emplearemos N = 100 dados. 
Partiremos de una configuración inicial de todo blanco y modificaremos los 
colores de los dados según las mismas reglas de antes: se selecciona un dado al 
azar, se lanza y se vuelve a colocar en su sitio. Admito que son reglas muy 
artificiales, pero en el capítulo 7 veremos que, en principio, en un sistema físico 
real puede conseguirse una evolución cromática similar cuya «fuerza 
impulsora» es la segunda ley de la termodinámica. 

í,Qué observaremos? Obviamente, aquí no podemos « representar» sumas de 
puntos. Podríamos haber asignado un «0» al blanco y un « 1» al negro, y 
representar la evolución del número de puntos con el tiempo o el número de 
pasos. Pero en este experimento sólo queremos ver lo que pasa. La figura 5.2 
muestra la evolución del color « promedio» a medida que transcurre el juego. Si 
partimos de un blanco cien por cien, la ascensión se mide como el porcentaje de 
negro anadido. 



Figura 5.2. 


A1 principio no notaremos nada. Por lo que hemos visto en el capítulo 4, 






sabemos que debe haber una pronunciada tendencia « ascendente» hacia el 
negro. Pero el efecto de unos pocos píxeles azules será imperceptible a nuestros 
ojos. Amedida que avance el juego comenzaremos a notar que ei sistema vira 
lentamente del blanco al gris. Cuando se alcance cierta tonalidad de verde (un 
gris compuesto de un 50% de negro y un 50% de blanco), el color del sistema 
permanecerá invariable. Difícilmente observaremos cambios ulteriores. Quizás 
alguna fluctuación en torno a la «línea verde» de equilibrio, pero casi nunca 
« visitaremos» el blanco puro o el negro puro. Nótese que, incluso para un N tan 
pequeno como 100, todas las fluctuaciones cromáticas se mantienen en la gama 
del gris. Para valores de N muy grandes no observaremos fluctuaciones, y 
aunque siga habiendo cambios, el color promedio permanecerá casi constante, 
con una mezcla a partes iguales de negro y blanco. 

En el capítulo 7 veremos que este experimento puede llevarse a cabo con 
partículas reales (dos isómeros de distinto color). Por el momento, quedémonos 
con que, partamos de la confíguración inicial que partamos, la aplicación de 
nuestras reglas nos llevará al mismo color final (de equilibrio). 


Con el olfato. 


Ahora describiremos otra pequena variación sobre el tema de la segunda ley. 
Como en el ejemplo anterior, tenemos dados con caras de dos tipos y la misma 
probabilidad. Supondremos que cuando un dado muestra una cara dei tipo A, 
emite cierto olor, y cuando muestra una cara del tipo B, emite otro. Si tenemos 
cien dados, N = 100, con una configuración arbitraria de olores A y B, 
percibiremos un olor promedio de tipo A + B, en proporción a la razón entre 
caras A y caras B de esa configuración. Nótese que el sentido del olfato es 
resultado de la adsorción de moléculas específicas por receptores 

específicos^] 

Como veremos en el capítulo 7, se puede llevar a cabo un experimento 
análogo con moléculas reales. En principio, podríamos seguir la evolución del 
olor de un sistema como nuestro olfato, conforme a la segunda ley de la 
termodinámica. Pero aquí nos limitaremos a examinar un experimento de 
mentira con dados que emiten dos moléculas de distinto olor. 

Una vez más partimos de una configuración de todo A y comenzamos a 
lanzar un dado cada vez como en el capítulo 4. Pero ahora introducimos una 
pequena variación de las reglas: tomaremos dos dados al azar, los lanzaremos y 
oleremos la confíguración resultante. E1 lanzamiento de A o B, con probabilidades 
1/2 y 1/2. Por ejemplo, supongamos que las caras A emiten moléculas con olor 


de hojas verdes, y las caras B emiten moléculas que huelen a rosas rojas (fígura 
5.3). 

Inicialmente percibimos el olor de tipo^4 puro. Después de unos cuantos pasos 
seguimos oliendo lo mismo, aunque sabemos que es altamente probable que el 
sistema « ascienda» hacia una mezela de A y B. Pero un porcentaje tan pequeno 
de B no es perceptible ni por los profesionales de la perfumería o Ia cosmética. 
La figura 5.3 muestra la evolución del olor del sistema con 100 dados. 
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Figura 5.3. 


Si partimos del olor a hojas verdes, al cabo de muchos pasos comenzaremos 
a notar Ia presencia del olor B, todavía muy tenue en comparación con el olor A 
dominante. Más adelante llegaremos a un punto en el que Ia razón entre los olores 
A y B será 1:1, en concordancia con la «línea de equilibrio» de las 
configuraciones de dados. Una vezque tengamos esa mezcla de olores concreta, 
ya no notaremos más cambios. Sabemos que hay fluctuaciones, pero apenas se 
apartarán del olor de equilibrio. Si aumentamos el número de dados 
alcanzaremos un olor de equilibrio prácticamente constante, sin desviaciones 
apreciables. 

Como he senalado antes, aunque éste es un proceso muy hipotético, Io cierto 
es que se puede disenar un experimento real y seguir la evolución del olor 




general de una mezela de moléculas con distintos olores. Discutiremos esta clase 
de experimento en el capítulo 7. De hecho, el experimento real es mucho más 
fácil de realizar que el nuestro con dados hipotéticos. 


Con el gusto. 


Como hemos hecho con los olores, podemos concebir un experimento donde 
usemos el sentido del gusto. Aquí volveremos a cambiar las reglas. Como 
siempre, jugaremos con cien dados, cada uno de los cuales tendrá tres caras de 
sabor dulce (a almíbar, por ejemplo) y otras tres caras de sabor ácido (a zumo 
de Iimón, por ejemplo). Procedemos a probar el sabor «promedio» del 
sistemat^] E1 sabor que experimentamos es inespecífíco. No distinguimos entre 
diferentes configuraciones específicas de los dados; nuestro sentido del gusto sólo 
puede percibir la razón entre dulce y ácido. 

Partimos de una confíguración de sabor ácido al cien por cien (representada 
en amarillo en la figura 5.4). En vez de elegir el dado que vamos a lanzar al azar, 
Ios vamos lanzando por orden, de izquierda a derecha. Tomamos un dado, lo 
lanzamos, probamos la configuración resultante y luego pasamos al siguiente 
dado de la secuencia, y así sucesivamente. Si tenemos cien dados, 
comenzaremos por el número uno y acabaremos por el número cien. Luego 
repetiremos la secuencia de lanzamientos diez veces, hasta completar 1000 
pasos. La figura 5.4 muestra la evolución del sabor en este juego. 

Apesar del cambio de reglas, la evolución del juego es a grandes rasgos la 
misma de antes. Partimos de un sabor puramente ácido, y al principio no 
notamos ningún cambio apreciable en el sabor general. Amenos que uno sea un 
gourmet o tenga un sentido del gusto excepcional, no diferenciaremos entre un 
100% de sabor ácido y una mezcla de un 99% de ácido y un 1% de dulce. Pero 
como ya sabemos a partir de nuestro análisis del capítulo 4 (o de la propia 
experiencia con dados, o de un experimento real como el descrito en el capítulo 
7), el sistema muestra una pronunciada tendencia a « ascender» , en este caso 
hacia el sabor agridulce. A1 cabo de un millar de pasos notaremos que el sabor es 
casi mitad ácido y mitad dulce, y una vez alcanzado este «niveb> no 
percibiremos más cambios de sabor. Por supuesto, el mecanismo para cambiar 
el gusto de cada dado es el mismo que en los experimentos anteriores. Pero los 
cambios son tales que el sabor general, como la suma total de nuestros dados del 
capítulo 4, no cambia de manera apreciable. Notaremos el mismo sabor 
agridulce « siempre» . Aunque sabemos que hay fluctuaciones, nuestra lengua 
apenas las percibe. E1 sistema ha alcanzado la línea de equilibrio agridulce, sin 
visitar « nunca» ni el ácido inicial ni el dulce puro. 
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Figura 5.4. 


Con el oído. 


En este experimento describiremos un proceso hipotético que nos permitirá 
experimentar la segunda ley a través del oído. De nuevo cambiamos un poco las 
reglas: en vez de dos resultados posibles, ahora tendremos tres. Recurriendo otra 
vez al lenguaje de los dados, supondremos que cada dado tiene dos caras 
marcadas con la letra A, otras dos con la letra B, y otras dos con la letra C (figura 
5.5). También supondremos que cuando sale A se emite un tono. Podemos 
imaginar que las caras de los dados son membranas que vibran a distintas 
frecuencias. Nuestro oído percibe Ias ondas sonoras emitidas como tonos 
diferentes^]. E1 sonido no tiene por qué provenir del dado mismo; podemos 
pensar que cada resultado es una senal para que un diapasón genere el tono A si 
sale A, otro diapasón genere el tono B si sale B, y un tercer diapasón genere el 
tono C si sale C. 

Una vez más, partimos de una configuración inicial uniforme, como todo A, y 
procedemos con las mismas reglas de antes, salvo que tenemos tres 






« resultados» posibles en vez de dos. Se elige un dado al azar y se lanza para 
obtener A, B o C. 

Haciendo casi el mismo análisis que en el capítulo 4, podemos seguir la 
evolución del sistema no a partir de « suma» de puntos, sino en términos del 
sonido general que oímos. 

A1 principio oiremos un tono A puro. Sabemos que el sistema tiende a 
« ascender» no a una nueva « suma», sino a una mezela de tonos, todavía 
dominada por^l. Sijugamos con N= 100 dados de esta clase, al principio apenas 
notaremos algo. Si uno tiene buen oído musical, al cabo de un rato comenzará a 
oír una mezcla de tonos (un acorde) que resultará más agradable de escuchar si 
A, B y C son notas armoniosas. 





Con el tiempo se alcanzará un tono de equilibrio. Escucharemos un acorde 
armonioso formado por los tres tonos A. By C, todos con el mismo peso. Una vez 
alcanzado ese nivel, el sistema se mantendrá allí « siempre» . Habrá algunas 
fluctuaciones en los pesos relativos de los tres tonos, pero apenas serán audibles ni 
por los oídos más entrenados musicalmente. 


Con el tacto. 


En este último ejemplo describiremos una versión extremadamente 
hipotética de un experimento real que tiene que ver con la temperatura. 

Percibimos la temperatura de un cuerpo frío o caliente a través de nuestra 
piel^]. Es una sensación cuyo origen molecular se resistió durante largo tiempo 
a la comprensión. Hoy día la teoría molecular del calor está bien establecida, 


pero al lego todavía le cuesta aceptar que la temperatura no es más que la 
velocidad « media» del movimiento (traslación, rotación y vibración) de los 
átomos y moléculas que constituyen la materia. Sentimos que un bloque de hierro 
está frío o caliente, pero no sentimos el movimiento de los átomos de hierro. En la 
vida diaria contemplamos la temperatura y el movimiento como nociones muy 
diferentes correspondientes a fenómenos no relacionados entre sí. Una bola a 
gran velocidad puede estar muy jría, y una bola inmóvil puede estar muy 
caliente. Pero uno de los grandes logros de la teoría molecular de la materia es la 
identificación de la temperatura (la sensación de caliente o frío) con la velocidad 
media de los átomos y moléculas. Esta idea no resultó fácil de aceptar antes del 
asentamiento de la teoría atómica de la materia. Pero en la actualidad esta teoría 
está bien establecida y cuenta con una aceptación plena. 

Este experimento ha sido ideado para hacer uso de nuestro quinto y último 
(reconocido) sentido. Los dados de este juego tienen tres caras calientes 
(digamos a 100 °Q y tres caras frías (digamos 0 0 C)t^^. Cada cara tiene una 
temperatura fija^]. También suponemos que las caras están perfectamente 
aisladas entre sí (de otro modo la auténtica segunda ley de la termodinámica 
haría que las moléculas que constituyen los propios dados equilibraran la 
temperatura de las caras inicialmente frías y calientes, dando al traste con 
nuestro experimento). En la figura 5.6, las caras frías se representan en azul y las 
calientes en rojo, como suele indicarse en los grifos. 

Jugamos otra vez con cien dados, todos con las caras frías arriba, de manera 
que si tocamos el conjunto notaremos una sensación fría. Se juega como en el 
capítulo 4, pero con una variante. Aquí también seleccionamos un dado al azar 
cada vez, pero el cambio de cara no se consigue lanzándolo, sino de manera 
determinista. Si es frío, se cambia a caliente, y si es caliente, se cambia a frío. 

Si los dados son tan pequenos que pueden verse como « pbceles» a distinta 
temperatura, cuando toquemos el conjunto de cien dados sólo sentiremos la 
temperatura promedio del sistema. No podemos discriminar entre 
configuraciones específicas (si este o aquel dado está frío o caliente), sólo se 
percibe la configuración inespecífica, o la temperatura general (es decir, sólo la 
razón de frío a caliente). A medida que progrese el juego, notaremos un 
incremento gradual de la temperatura. 


FRIO 


CALIENTE 
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Figura 5.6. 


A1 cabo de un tiempo se alcanzará una temperatura de equilibrio. Apartir de ese 
momento, la temperatura del conjunto dejará de aumentar, manteniéndose casi 
constante a 50 °C, y no volveremos a notar ningún cambio (figura 5.6). 

Con este último ejemplo hemos terminado nuestro ejercicio de percepción 
sensorial de la segunda ley en un sistema de dados. En el próximo capítulo 
desvelaremos el principio subyacente tras todos estos experimentos, y en el 
capítulo 7 analizaremos su relevancia para el mundo real de la segunda ley. 
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Fin del capítulo 5. 
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Por último, apliquemos el sentido común 


Tras haber experimentado diversas manifestaciones de la segunda ley 
mediante dados, es hora de que nos detengamos a analizar y racionalizar lo que 
hemos aprendido. Recordemos que hemos observado diferentes fenómenos con 
diferentes mecanismos. En el capítulo siguiente veremos que algunos de esos 
modelos (color, sabor y olor) tienen contrapartidas experimentales reales. Otros 
modelos no pueden llevarse a la práctica con partículas (las partículas no emiten 
ondas sonoras, y la temperatura que captamos con la punta de los dedos tiene que 
ver con la distribución de velocidades moleculares; no se puede asignar una 
temperatura propia a cada molécula). Por supuesto, hay muchos otros ejemplos. 
La cuestión central que nos interesa en este capítulo es: ^cuáles son los rasgos 
comunes a todos los fenómenos observados en los experimentos descritos en los 
capítulos 4 y 5? Los fenómenos que examinaremos en este capítulo son 
esencialmente los que ya hemos visto, sólo que con valores de N muy grandes, 
mucho más que el mayor de los considerados hasta ahora. 

Las tres preguntas que tenemos que hacernos son: 

1) iQué es lo que, en todos los procesos observados, hemos visto 
evolucionar hacia algo que hemos llamado «línea de 
equilibrio» , para luego instalarse allí sin cambios apreciables? 

2) ^Cómo hemos conseguido dicha evolución? ^Cuál es el aspecto 
esencial del mecanismo que nos lleva del estado inicial al estado 
final? 

3) (,Por qué el cambio tiene lugar en un solo sentido, y deja de 
observarse una vezalcanzada la línea de equilibrio? 

Discutiremos estas cuestiones para los experimentos prototípicos simples con 
dados de dos resultados posibles. Nuestras conclusiones serán aplicables a los 
otros tipos de dados que hemos manejado en los capítulos precedentes, así como 
los experimentos reales que veremos en el próximo capítulo. 

Recordemos que nuestro sistema consiste en N dados. E1 resultado del 



lanzamiento de cualquier dado es «0» o « 1», cada uno con probabilidad 1/2. 
Hemos prescrito las reglas para variar la configuración de los dados. Hemos visto 
que las reglas pueden cambiarse. Lo importante es que haya al menos un 
elemento de azar: o seleccionamos un dado al azar y lo cambiamos de manera 
determinista, o seleccionamos cada dado siguiendo un orden predeterminado y lo 
lanzamos para obtener un nuevo resultado al azar, o hacemos ambas cosas al 
azar. 

Hemos definido un suceso específico o configuración específica como la 
especificación de los resultados de cada dado individual. La configuración exacta 
de los cuatro dados de la fïgura 6.1 es: el prhner dado (rojo) por la izquierda 
muestra un «0», el segundo dado (azul) muestra un « 1», el tercero (verde) 
muestra un « 1» y el último (amarillo) muestra un « 0» . Esta especifîcación nos 
proporciona una descripción completa y detallada del sistema. 

Hemos llamado suceso o estado inespecífico, o configuración inespecífica, a 
una descripción menos detallada del sistema. De un suceso inespecífico sólo se 
especifica el número de unos (o el de ceros) con independencia de qué dados 
portan un « 1» y cuáles portan un «0» . Así, una descripción inespecífica del 
sistema de la figura 6.1 es simplemente 2, o inespecífico-2. 

Cuando pasamos de la configuración específica a la configuración 
inespecífica no tenemos en cuenta la identidad de cada dado (nos da igual que 
sea rojo o azul, o que sea el primero o el segundo de la fila). Decimos que, en 
esta descripción, los dados son indistinguibles. Aquí ignoramos voluntariamente la 
identidad de los dados, pero en el mundo real los átomos y moléculas son 
indistinguibles por su propia naturaleza, y ésa es una diferencia importante entre 
dados y átomos, cuya discusión abordaremos en el capítulo siguiente. 





Figura 6.1. 


Hay dos características de la configuración inespecífica a las que debemos 
prestar especial atención. En primer lugar, para cualquier descripción 




inespecífica del tìpo « hay n unos en un sistema de N dados», el número de 
descripciones específicas correspondientes a la descripción inespecífica aumenta 
con N. Amodo de ejemplo simple, considérese la descripción inespecífica « hay 
un solo uno [n = 1} en un sistema de N dados» . Esta descripción inespecífíca 
comprende exactamente iVconfiguraciones específicas. 

En segundo lugar, fijado N, el número de configuraciones específicas 
comprendidas por una misma configuración inespecífica crece a medida que n 
aumenta de 0 a N/2 (si N es par hay un máximo, y si es impar hay dos). Ya 
hemos observado esta clase de dependencia en el capítulo 4. La figura 6.2 ofrece 
otro ejemplo para un sistema de N= 1000 dados, donde n varía de cero a N. 

Es importante tomar nota de estas dos tendencias. Ello requiere una 
contabilidad que puede ser tediosa para valores grandes de N y n, pero no hay 
ninguna dificultad inherente y no se requieren matemáticas sofisticadas; lo único 
que hay que hacer es contar. 

Tras haber definido las configuraciones específica e inespecífica, podemos 
responder a la primera pregunta planteada al principio de esta sección: ^qué es lo 
que cambia a cada paso en los juegos descritos en los capítulos 4 y 5, y es común 
a todos ellos? 



Figura 6.2. 


Está claro que aquello cuyo cambio hemos observado es diferente en cada 




experimento. En un caso vemos un cambio de color, de amarillo a verde, y en 
otros casos percibimos cambios de olor, sabor, temperatura, etcétera. Se trata de 
manifestaciones diferentes del mismo proceso subyacente. Lo que nos interesa 
ahora es lo que cambia en todos los experimentos que hemos examinado en los 
dos capítulos anteriores. 

Volvamos al juego de « 0» o « 1» del capítulo 4. Allí registrábamos la suma 
de los resultados de cada dado. Obviamente, en los experimentos del capítulo 5 
no podemos registrar ninguna « suma» de resultados. Pero, así como en el juego 
del capítulo 4 calculábamos la « suma» a partir del número de unos, podemos 
asignar un «1» y un « 0» a los dos colores, los dos gustos o las dos temperaturas 
y contabilizar el número de unos en cada uno de los juegos propuestos en el 
capítulo 5. Esto puede valer, pero no es totalmente satisfactorio. Tenemos que 
encontrar un nombre apropiado para referirnos a lo que tienen en común todos 
Ios experimentos, y darle un valor numérico. Este valor debe aumentar hasta 
alcanzar una línea de equilibrio. Llamemos provisionalmente d-entropía (d de 
dado), o simplemente dentropía, a esta magnitud. Por el momento, esto no es 
más que una denominación carente de signifícado. 

La descripción anterior puede valer para los juegos de dados que hemos visto. 
Pero el lector podría plantear dos objeciones. En primer lugar, sabemos que la 
entropía (real) siempre aumenta. En los juegos con dados, la dentropía 
aumentará si partimos de una configuración de « todo ceros» . Ahora bien, iy si 
partimos de una configuración de «todo unos» ? En tal caso la dentropía 
disminuirá, lo cual contradice lo que sabemos de la entropía real. La segunda 
objeción podría ser ésta: $ si hay tres resultados posibles, digamos « 0» , « 1» y 
« 2», o incluso resultados no numéricos como tres sonidos A, B y C, o tres 
colores, o cuatro, o incluso una gama infínita de colores, velocidades o lo que 
sea? i,Qué número deberíamos registrar? 

Aestas objeciones se puede responder que una cosa es lo que observamos o 
sentimos en cada juego concreto, y otra cosa es lo que registramos. 

En nuestro juego de dados simple, hemos registrado el número de unos. Este 
número aumenta sólo si partimos de una configuración de todo ceros. De haber 
partido de una configuración de todo unos, la suma descendería hasta la línea de 
equilibrio. A continuación veremos que una transformación simple nos permite 
registrar aquello que siempre aumenta hasta que el sistema alcanza la línea de 
equilibrioI 81 l P ara ello necesitaremos el símbolo del valor absoluto que hemos 
definido en el capítulo 2. 

En vez del número de unos, denotado por n, podemos registrar el número | n - 
N/2\. Recordemos que N e s el número de dados y n el número de « unos» . Así 
pues, esta diferencia mide la desviación, o la « distancia» , entre n y la mitad del 
número de dados. Tomamos el valor absoluto para que la distancia entre, por 


ejemplo, n = 4 y N/2 = 5 sea la misma que la distancia entre n = 6 y Nl2 = 5. Lo 
que importa es la separación del número N/2^^, el cual, recordemos, marca la 
línea de equilibrio. 

Si partimos de una configuración de todo ceros, tenemos n = 0, de donde | n - 
N/2\ = N/2. Si partimos de una confíguración de todo unos, tenemos n = N, y de 
nuevo | n - N/2\ = N/2. La distancia es la misma en ambos casos. Este número 
tenderá a variar de N/2 a 0. Tenemos así una cantidad que casi siempre decrece a 

partir de cualquier configuración inicial^]. Una vez que se alcanza el valor 
mínimo de |n - N/2\ = 0, estamos en la línea de equilibrio. E1 lector puede 
comprobarlo para, digamos, N= 10 y todos los valores posibles de n. Si no le 
gusta obtener cifras decrecientes, puede tomar sus valores negativos^^], —| n - 
N/ 2|, con lo que tendrá un incremento constante de —N/2 a cero. Si no le gustan los 
números negativos, puede tomar N/2 — |n — N/2\. Este número aumentará 
continuamente a partir de cualquier confíguración inicial hasta un máximo de N/2 

en todos los casos^], Como puede verse, mediante una simple transformación 
podemos definir una nueva cantidad que « siempre» aumenta con el tiempo (o el 
número de pasos). Pero esto no responde a la segunda objeción. Está bien para 
juegos con sólo dos resultados posibles, pero no puede aplicarse al caso más 
general de dados con tres o más resultados posibles. Así pues, tenemos que 
encontrar una cantidad común a todos los experimentos posibles del estilo de los 
descritos en los capítulos 4 y 5. 

Ahora construiremos una cantidad que siempre aumentará y valdrá incluso 
para los casos más generales. Hay muchas posibilidades, pero nos quedaremos 
con la que más se acerca a la magnitud llamada entropía. Para ello necesitamos 
el concepto de información o, más exactamente, la medida matemática de la 
información. 

La magnitud elegida para describir la cosa que cambia es la «información 
perdida» . La denotaremos por IP (por ahora, IP no es más que un acrónimo de 
« información perdida» , pero en el próximo capítulo la identificaremos con el 
concepto de entropía). 

Además de describir cuantitativamente lo que cambia en el proceso, esta 
magnitud tiene la ventaja de que se ajusta a lo que se entiende por información 
en la vida diaria, y nos proporciona un número que describe lo que cambia desde 
cualquier estado inicial hasta el estado final, y para cualquier juego en general. 
Es un número siempre positivo, que aumenta tanto en nuestros juegos de dados 
como en el mundo real. Y lo que es más importante, es la medida común a todos 
los juegos de dados, lo que antes hemos llamado provisionalmente « dentropía» . 
También será idéntica a la magnitud común a todos los sistemas fisicos, la 


entropíat^] 

La definición cualitativa es ésta: nos dan una configuración descrita de 
manera inespecifica, como « hay n unos en el sistema de Vdados» , de la que no 
tenemos una información exacta, y nuestra tarea consiste en hallar la 
configuración específica dada^] 

Obviamente, a partir de la configuración inespecífica sin más no podemos 
inferir la configuración específica; necesitamos más informacìón. Esta 

información que nos falta es lo que llamamos información perdida o zp[88] 
^Cómo la obtenemos? Planteando preguntas binarias. Podemos definir la 
información perdida como el número de preguntas binarias que tenemos que 
hacernos para adquirir dicha información, esto es, el conocimiento de la 
configuración específica. 

En el capítulo 2 hemos visto que la información perdida se define de manera 
que sea independiente del procedimiento para adquirirla. En otras palabras, no 
importa la estrategia que adoptemos. La información perdida « está ahí» , en el 
sistema. Pero si aplicamos la estrategia más inteligente podemos identificar la 
información perdida con el nùmero medio de preguntas binarias requeridas. Así, 
para emplear el número de cuestiones binarias como medida de la cantidad de 
información perdida debemos adoptar la estrategia más inteligente, tal como se 
describe en el capítulo 2. Por supuesto, cuanto mayor sea la información perdida, 
mayor será el número de preguntas requeridas para recuperarla. Veamos unos 
cuantos ejemplos. 
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Figura 6.3. 


Dada la información de que « hay un solo uno en un sistema de 16 dados» 
(figura 6.3), ^cuántas preguntas tendremos que hacer para conocer la 






configuración exacta o específíca? 

Es el mismo problema que el de hallar la moneda escondida en una de 16 
cajas igualmente probables (véase la figura 2.9). Para resolver este problema 
aplicábamos la estrategia de eliminar la mitad de las posibilidades a cada paso 
(véase el capítulo 2). Comenzamos preguntando si la moneda está en la mitad 
superior. Si la respuesta es afirmativa, preguntamos si está en la mitad superior 
derecha. Si es que no, simplemente nos quedamos con la otra mitad. Con esta 
estrategia, encontraremos la moneda después de hacer sólo tres preguntas. Aquí 
adoptaremos la misma estrategia. Obviamente, si tenemos que encontrar un « 1» 
entre uniVmayor, como puede ser jV= 100 o 1000, la información que debemos 
obtener será mayor y tendremos que hacer más preguntas. Inténtese calcular el 
número de preguntas necesarias si el único « 1» está en alguno de N= 32 y N = 
64 dadost^]. 

Ahora supongamos que nos dicen que hay dos unos en un sistema de 16 dados 
(figura 6.4). Para adquirir la información perdida en este caso tenemos que 
hacer más preguntas. Primero podemos hacer preguntas para situar el primer 
« 1» , y luego volver a empezar para localizar el segundo « 1» entre los 15 dados 
restantes. 

Parece claro que, fíjado N, el número de preguntas requeridas para obtener 
la información que queremos aumenta con n. 
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Figura 6.4. 


Cuanto mayor sea n, más preguntas tendremos que hacer para localizar todos 
los unos (o todas las monedas escondidas). 

E1 número de preguntas requeridas es fácil de calcular para cualesquiera n y 
N. Simplemente comenzamos haciendo preguntas para determinar la situación 
del primer « 1» entre los JVdados, luego hacemos lo propio para determinar la 






situación del segundo « 1» entre los N~ 1 dados restantes, luego determinamos la 
situación del tercer « 1» en los N— 2 dados restantes, y así sucesivamente hasta 
tener toda la información sobre los n dados con un « 1» . Esto vale para todo valor 
de n por debajo de N/2. 

También debemos ser lo bastante inteligentes no sólo para adoptar la mejor 
estrategia, sino también para decidir en cuál de los resultados posibles nos 
fijaremos. Si n es mayor que N/ 2, es mejor preguntarnos por las localizaciones 
de los ceros en vezde los unos. Por ejemplo, si nos dicen que hay tres unos en un 
sistema de cuatro dados, la información perdida es la misma que si nos dijeran 
que hay un solo uno en un sistema de cuatro dados. En este caso será más 
inteligente hacer preguntas para situar el único « 0» . Bastarán dos preguntas para 
determinar la configuración exacta. 

Así pues, la información perdida aumenta con n para un N fijo. Para un N 
fijo, la información perdida aumenta con n desde n = 0 (cuando no hay ningún 
« 1» no necesitamos hacer ninguna pregunta) hasta n = N/2 o (N + l)/2 si N es 
impar y luego disminuye por encima de n = N/2. Cuando n alcanza su valor 
máximo N, la información perdida vuelve a ser nula (cuando no hay ningún « 0» 
tampoco necesitamos hacer ninguna pregunta)^]. 

Un procedimiento similar vale para los casos donde hay más de dos 
resultados posibles. Es algo más complicado, pero no es esencial para entender la 
segunda ley. 

Ahora tenemos un número, que hemos llamado información perdida, el cual 
describe la cantidad de información necesaria para especifïcar la confíguración 
exacta cuando sólo conocemos la confíguración inespecífíca. Este número puede 
calcularse fácilmente para valores de n y Vdados^l]. 

Volvamos a nuestro juego del capítulo 4, donde llevábamos la cuenta de la 
suma del número de unos en la evolución del juego. En vez de estos dos números 
equivalentes, ahora registraremos la información perdida a cada paso. Ésta es 
una magnitud más general (puede aplicarse a cualquier tipo y número de 
resultados posibles) que siempre aumenta (con independencia del estado de 
partida) hasta alcanzar un máximo en algún punto (en este caso n = N/ 2). Y, lo 
que más nos importa, se puede demostrar que es idéntica a la entropía de un 
sistema real. 

Hay que subrayar que la información perdida es la cantidad que hemos 
elegido para seguir la evolución del juego. Hay muchas otras opciones posibles 
(como el número de unos, la suma de puntos, o el resultado de N/2 — \n — Ní 2|). 
Lo que cambia es el estado inespecífíco, o la configuración inespecífica, del 
sistema. E1 número que hemos asignado a estos estados no es más que un índice 
que puede evaluarse y seguirse. E1 mismo índice puede aplicarse a cualquiera de 


los experimentos descritos en los capítulos 4 y 5, donde los resultados no son 
números, sino puntos, colores, sonidos, olores, sabores o temperaturas. Todo esto 
son manifestaciones diferentes del mismo proceso subyacente, el cambio desde 
una configuración inespecífica con un índice bajo (que puede ser la suma o la 
información perdida) hasta una configuración inespecífica con un índice más 
alto. Sólo nos queda darle a este índice un nombre. Por el momento lo 
llamaremos « información perdida» , una denominación que no suscita ningún 
misterio. En cuanto tenemos un nombre para el índice que estamos registrando, 
que además tiene el significado de informaciónt^, podemos prescindir del 
término provisional « dentropía» . Más adelante veremos que la información 
perdida es esencialmente lo mismo que la entropía del sistema^l. 

Pasemos ahora a la segunda pregunta planteada al principio de este capítulo. 
lCómo pasamos del estado inicial al estado final? 

La respuesta es muy simple en el caso de los juegos de dados que hemos 
visto. Hemos prescrito las reglas del juego, las más simples de las cuales son: 
seleccionar un dado al azar, Ianzarlo para obtener un nuevo resultado aleatorio, y 
registrar el nuevo estado inespecífico. Esto responde a la cuestión del « cómo» . 

También hemos visto que tenemos cierta libertad a la hora de elegir las 
reglas. Podemos seleccionar cada dado por orden (de izquierda a derecha, o de 
derecha a izquierda, o de cualquier otra manera prescrita), y luego lanzarlo para 
obtener un resultado aleatorio; o podemos seleccionar el dado al azar y luego 
obtener el nuevo resultado de manera predeterminada (si es «0» se cambia a 
« 1», y si es « 1» se cambia a «0», por ejemplo). Hay muchas otras reglas 
aplicables, como seleccionar dos (o tres, o cuatro, o más) dados al azar y luego 
lanzarlos todos a la vez. La evolución del juego a cada paso diferirá algo en 
algunos detalles, pero a grandes rasgos será la misma que hemos observado en 
Ios experimentos del capítulo 5. Lo importante es que cada dado tenga las 
mismas oportunidades de cambiar, y que el proceso contenga un elemento de 
azar. Dentro de estos límites, hay muchas reglas posibles para conseguir el 
cambio. 

Hay que decir que es fácil idear alguna regla no aleatoria que haga que la 
evolución sea muy diferente. Por ejemplo, si tomamos cada dado por orden, 
digamos de derecha a izquierda, y luego conmutamos de manera 
predeterminada el «0» por el « 1» o el « I» por el «0», a partir de una 
configuración de todo ceros el sistema evolucionará hacia una configuración de 
todo unos, luego volverá a todo ceros, y así sucesivamente: 

{ 0 , 0 , 0 , 0 } { 1 , 0 , 0 , 0 } { 1 , 1 , 0 , 0 } -* { 1 , 1 , 1 , 0 } 

{ 1 , 1 , 1 , 1 } { 0 , 1 , 1 , 1 } { 0 , 0 , 1 , 1 } { 0 , 0 , 0 , 1 } 

{ 0 , 0 , 0 , 0 )^ { 1 , 0 , 0 , 0 } ^... 


En tal caso, la evolución del sistema es totalmente diferente de la que hemos 
visto en los capítulos 4 y 5. 

También podríamos prescribir reglas que no induzean cambio alguno (como 
tomar un dado al azar y no cambiarlo de cara) o hagan ir de la configuración de 
todo ceros a la de todo unos (como cambiar los dados por orden de « 0» a « 1» y 
de « 1» a « 1»), Estas reglas no nos interesan. Como veremos en el próximo 
capítulo, estas reglas no tienen contrapartidas en el mundo físico. 

La conclusión es que la respuesta a la pregunta del « cómo» es muy simple. 
Todo lo que se requiere es definir las reglas de manera que contengan algún 
elemento de aleatoriedad y den a cada dado las mismas posibilidades de 
cambiar. 

Hemos dejado para el final la pregunta más importante. ^Por qué el sistema 
evoluciona en el sentido de un incremento de la información perdida (o, en los 
juegos del capítulo 4, por qué la suma del número de unos tiende a instalarse en 
una línea de equilibrio)? 

La respuesta a esta pregunta reside en el núcleo mismo de la segunda ley de 
la termodinámica. Aunque la solución que daremos ahora al problema es 
estrictamente pertinente para nuestros juegos de dados simples, veremos que 
también se aplica a los procesos físicos reales. 

Como en cualquier ley de la física, hay dos respuestas posibles a nuestro 
« por qué» . Uno puede simplemente decir que « así son las cosas», ni más ni 
menos. No hay manera de comprender las leyes del movimiento de Newton más 
profundamente. Una bola en movimiento que no se vea interrumpida por ninguna 
fuerza continuará desplazándose en línea recta a velocidad constante para 
siempre. ^Por qué? No hay respuesta a esta pregunta. Así son las cosas. Así 
funciona la naturaleza. No hay ninguna razón lógica, ni explicación. De hecho, 
esta ley parece « antinatural» , ya que entra en conflicto con lo que observamos 
normalmente en el mundo real. Una persona sin formación científica que leyó el 
manuscrito de este libro mostró su sorpresa ante la citada ley con estas palabras: 
« Todo el mundo sabe que una bola en movimiento siempre acabará parándose» . 
Las leyes del movimiento no se basan en, ni son reducibles a, el sentido común. 
Es más, las leyes de la mecánica cuántica son incluso contraintuitivas, y desde 
luego no nos parecen lógicas ni naturales (probablemente porque no « vivimos» 
en el mundo microscópico, por lo que los efectos cuánticos no forman parte de 
nuestra experiencia diaria). 

La segunda manera de responder consiste en buscar un principio subyacente 
más profundo que explique la ley. Esto es lo que la gente ha intentado hacer con 
la segunda ley durante décadas. La segunda ley de la termodinámica es única en 
el sentido de que podemos dar una respuesta al « por qué» basada en la lógica y 
el sentido común (una característica no compartida por ninguna otra ley de la 



naturaleza salvo, quizá, la teoría de la evolución de Darwin)t^. 

En los capítulos anteriores hemos visto que hay numerosas manifestaciones 
diferentes de (esencialmente) el mismo proceso (y muchos otros en el mundo 
real). Aunque en los diversos experimentos descritos hemos registrado distintas 
manifestaciones (en un juego el número de «unos», en otro el número de 
« amarillos», en otro el número de « dulces»), hemos decidido emplear el 
mismo índice, la información perdida, para seguir la evolución de todos esos 
juegos. Se trata de descripciones diferentes del mismo proceso subyacente en 
esencia. « E1 sistema evoluciona hacia más verdor», « el sistema evoluciona 
hacia una suma mayor» , « el sistema evoluciona hacia la máxima información 
perdida» , etcétera^]. Se trata de descripciones correctas de lo que pasa, pero 
ninguna da respuesta al « por qué» . No hay ninguna ley de la naturaleza que 
obligue a un sistema a evolucionar hacia más verdor. Esto es obvio. Tampoco 
hay ninguna ley de la naturaleza que establezca que un sistema debe evolucionar 
hacia un aumento del desorden o de la información perdida. 

Si mi respuesta fuera «porque ir del orden al desorden, o de menos 
información perdida a más información perdida, es la manera de actuar de la 
naturaleza» , el lector, justificadamente, podría seguir haciendo preguntas. ^Por 
qué tiene que ser así? ï,Por qué el sistema tiene que ir de menos a más desorden, 
o de menos a más información perdida? En efecto, no hay ninguna ley que 
obligue a ello. Las cosas que hemos registrado sirven para describir la evolución 
del sistema, pero no para explicar su causa. Tenemos que encontrar una 
respuesta que no suscite otro « por qué» . 

La respuesta que buscamos es muy simple (y vale no sólo para todos los 
procesos que hemos visto hasta aquí, sino para todos los procesos reales). De 
hecho, al fmal se reduce al mero sentido común. 

Hemos visto que en cada juego, a partir de cualquier configuración inicial, el 
sistema pasa de una configuración inespecífica que comprende pocas 
configuraciones específicas a otra configuración inespecífica con un número 
mayor de configuraciones específicas. ^Por qué? Porque cada configuración 
específica es un suceso elemental, y como tal tiene la misma probabilidad que 
cualquier otro. Por lo tanto, las configuraciones inespecíficas que abarquen un 
número mayor de sucesos elementales serán más probables. Cuando N e s muy 
grande, la probabilidad de los estados inespecíficos hacia los que evoluciona el 

sistema es muy elevada (jcasi uno!)^í. Esto equivale a decir que: 

Los sucesos que se esperan más frecuentes serán más firecuentes. Para valores 
de Nmuy grandes, más Jrecuente equivale a siempre. 

Esto reduce la respuesta que buscábamos a una mera tautología. Como 
hemos visto en el capítulo 2, la probabilidad no es más que sentido común, igual 


que la respuesta que hemos dado a nuestro « por qué» . 

Los cambios que hemos observado en îodos los experimentos descritos van de 
estados inespecíficos de baja probabilidad a estados inespecíficos de elevada 
probabilidad. No hay nada misterioso en este hallazgo. No es más que una 
cuestión de sentido común. 

También queda claro desde este punto de vista que el incremento de la 
información perdida (como el de la entropía) no se asocia a ningún incremento 
material o energético. 

Si el comportamiento de la entropía es de sentido común, se estará 
preguntando el lector, i& qué viene todo ese discurso sobre el profundo misterio 
de la segunda ley? Intentaré responder a esta pregunta en el capítulo 8. De 
momento seguimos en el mundo de los dados. Le sugiero al lector que elija un 
valor de N (16, 32 o el que sea) y ejecute el juego mentalmente o en su 
ordenador, conforme a las reglas establecidas en los capítulos 4 y 5, que siga la 
evolución de las configuraciones y se pregunte qué es lo que cambia, cómo 
cambia y por qué cambia como lo hace. Las respuestas que encuentre serán 
relevantes para ese juego de dados, pero, como veremos en el capítulo siguiente, 
también serán relevantes para el comportamiento de la entropía en el mundo 
real. 
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Fin del capítulo 6. 


7 

Del mundo de los dados al mundo real 


En el capítulo anterior he asegurado que si uno ha entendido la evolución de 
los juegos de dados y tiene respuesta para el « qué», el « cómo» y el «por 
qué» , ya le falta muy poco para comprender la segunda ley; todo lo que queda 
por demostrar es que lo que nos han ensenado los dados es relevante para el 
mundo real. 

En este capítulo traducimos el lenguaje de los dados al Ienguaje de los 
experimentos reales. Comenzamos con el experimento más simple y mejor 
estudiado: la expansión de un gas ideal. 

Para facilitar la traducción, redefínamos el juego de dados del capítulo 4 
considerando dados con la letra D en tres de sus caras y la letra / en las otras tres. 
Así, en vez de « 0» y « 1», o amarillo y azul, o dulce y ácido, simplemente 
tenemos dos letras: I y D (I de «izquierda» y D de « derecha» , pero por el 
momento las veremos como dos resultados posibles de un dado, o de una 
moneda). Partiremos de una configuración de « todo I» y jugaremos conforme 
a las reglas prescritas en el capítulo 4. Podemos registrar cuántas veces aparece 
Ia « D» , o la « /» , o la información perdida. En este sistema, lo que veremos es 
que, al cabo de un tiempo, tanto el número de letras « D» como el número de 
letras «/» serán más o menos N/ 2, donde N es el número total de dados. La 
figura 7.1 muestra tres fasesde este juego con N= 10. 

Nótese que el estado inicial (inespecífíco-0) es único. Sólo hay un estado 
específico perteneciente a este estado inespecífico. 
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Figura 7.1. 


Para el estado intermedio (inespecífico-2 en la figura) tenemos muchos estados 
específicos (10 x 9/2 = 45). E1 último estado (inespecífico-5) abarca aún más 
estados específicos posibles (10x 9x 8x 7x 6/5! = 252). Éste es el estado 
inespecífico maximal. En la figura 7.1 hemos indicado algunas de las 
configuraciones específicas pertenecientes a los estados inespecífícos. 


La correspondencia con el proceso de expansión. 


Considérese el sistema experimental representado en la figura 7.2. Tenemos 
dos compartimentos separados del mismo volumen, uno etiquetado como D (el 
de la derecha) y otro etiquetado como I (el de la izquierda). E1 sistema contiene 
N átomos de gas (argón, por ejemplo) confinados inicialmente en el 
compartimento de la izquierda. Mientras no retiremos la separación, nada 
resenable ocurrirá. A1 nivel microscópico, las partículas están en un estado de 
agitación incesante, cambiando aleatoriamente de posición y velocidad. Pero al 
nivel macroscópico no hay ningún cambio detectable. Podemos medir la presión, 
la temperatura, la densidad, el color o cualquier otra propiedad, y no 
apreciaremos ningún cambio ni en el espacio ni en el tiempo. Diremos que el 
sistema está inicialmente contenido en el compartimento I y en estado de 

equilibrio^] Si retiramos la separación, pondremos en marcha la segunda ley. 
Ahora sí observaremos cambios. Podemos registrar el color, la presión, la 
densidad, etcétera, y veremos que estas magnitudes cambian con el tiempo y la 
posición. Los cambios observados siempre irán en una dirección: los átomos 























pasarán del compartimento / al compartimento D. Supongamos que registramos 
la densidad o el color en I. Veremos que la densidad (o la intensidad del color, si 
lo tiene) del gas decrece paulatinamente. A1 cabo de un tiempo el sistema 
alcanzará un nuevo estado de equilibrio y no observaremos más cambios en los 
parámetros que hemos estado registrando. Una vez instalado en ese nuevo estado 
de equilibrio, el sistema se mantendrá « siempre» en él, y « nunca» volverá al 
estado inicial. Este proceso es una manifestación relativamente simple de la 
segunda ley. 

En este proceso específico, partíamos de un estado de equilibrio (todos los 
átomos en /) y progresábamos hacia un nuevo estado de equilibrio (átomos 
ocupando todo el volumen de / y D). Repitamos el experimento, pero con una 
ligera variación que facilitará la traslación del juego de dados al mundo real. 
Supongamos que, en vez de suprimir la separación como en la figura 7.2, nos 
limitamos a abrir un agujero lo bastante pequeno para dejar pasar sólo una 
molécula, o a lo sumo unas cuantas, de / a D en cualquier momento dado. Si 
abrimos y cerramos esta minúscula abertura a intervalos cortos de tiempo, 
procederemos del estado inicial al estado final igual que antes, pero en este caso 
a través de una serie de estados de equilibrio intermedios^] 

La figura 7.3 muestra tres fases de este proceso. 

Ahora establezcamos la siguiente correspondencia entre el mundo de los 
dados y el mundo real del gas en expansión: cada dado corresponderá a un 
átomo específico (un átomo de argón, por ejemplo). Las caras «I» y «D» de los 
dados en el experimento del principio corresponden a la situación de un átomo 
específico en el compartimento de la izquierda y en el de la derecha, 
respectivamente. 



Figura 7.2. 


Para concretar más la correspondencia entre ambos «mundos», 
consideremos el caso N = 2, representado en la parte superior de la figura 7.4. 
Nótese que, en esta correspondencia, hacemos distinciones entre las partículas 
(en rojo y en azul). (En la parte inferior de la figura 7.4 se representa la 
correspondencia con el proceso de asimilación que describo más adelante en este 






capítulo). 

Defïnimos una configuración específica como una especificación completa 
de cada partícula en cada compartimento. En contraste con el mundo de los 
dados, donde podemos distinguir un dado de otro (aunque no hemos tenido en 
cuenta esta información al registrar sólo Ias cantidades pertinentes para la 
configuración inespecífica), aquí las partículas son indistinguibles de entrada, así 
que no tenemos que ignorar ninguna información. La indistinguibilidad es una 
propiedad de los átomos, algo que la naturaleza impone a las partículas. Los 
dados podrían ser idénticos en todos los aspectos, pero son distinguibles en el 
sentido de que podemos seguirlos de manera individual. Si agitamos diez dados 
idénticos, podemos fijarnos en un dado concreto y en cualquier momento 
podemos decir de dónde procede. A1 definir la confíguración inespecífíca, 
digamos cinco letras « D» en diez dados, podemos distinguir entre las diferentes 
configuraciones específicas. Podemos indicar los dados que portan una « D» y 
Ios que portan una «7», como queda claro en las figuras 7.1 y 7.4. Con los 
átomos no podemos hacer lo mismo. Todo lo que podemos conocer o evaluar es 
el número de átomos en D, pero no cuáles están enfly cuáles en I. Así, en el 
sistema representado en la figura 7.4 no podemos distinguir entre los dos estados 
específicos « partícula azul en I y partícula roja en D» y « partícula azul en D y 
partícula roja en I» . Ambos estados se confunden en un estado inespecífico: 
« una partícula en / y una partícula en D» . 
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Figura 7.3. 
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Figura 7.4. 


Decimos que una configuración es inespecífica cuando sólo especificamos el 
número de partículas en D (con lo que también se especifíca el número de 
partículas en /), con independencia de la situación detallada de cada átomo en / o 
D. Obviamente, cada confíguración inespecífica incluye numerosas 
configuraciones específicas (excepto en los casos extremos de todo D o todo I). 
Vuelvo a insistir en que todo lo que podemos medir o registrar es el número total 
de partículas enflo cualquier magnitud proporcional a dicho número (como la 
intensidad de color u olor, la densidad, la presión, etcétera). A diferencia de los 
juegos de dados, aquí no podemos « ver» la configuración específica. 

En razón de su importancia capital, volveremos a explicar la diferencia entre 
la configuración inespecífica y las configuraciones específicas correspondientes 
(fígura 7.5). 

Para ver mejor las distintas configuraciones específicas hemos asignado 
colores diferentes a las partículas. En un sistema de partículas (átomos y 
moléculas) no hay etiquetas (o colores) que nos permitan diferenciar una 
partícula de otra idéntica. Lo único que podemos observar o medir es la 
configuración inespecífica (a la izquierda de la figura 7.5). Hay que subrayar, sin 
embargo, que aunque no podamos distinguir entre configuraciones específicas, 
éstas contribuyen a la probabilidad de la configuración inespecífica. Aquí 

presuponemos que cada configuración específica es igualmente probable^]. 










Por lo tanto, la probabilidad de cada configuración inespecífica es la suma de las 
probabilidades de cada una de las configuraciones específicas correspondientes. 
Podemos pensar que los sucesos específícos (a la derecha de la figura 7.5) se 
confunden en un único suceso inespecífico (a la izquierda). Las probabilidades de 
los cinco sucesos inespecíficos son: 1/16,4/16, 6/16, 4/16, 1/16. 

Ahora estamos en disposición de responder al « qué» , el « cómo» y el « por 
qué» a propósito del experimento real. Como en el caso de los juegos de dados, 
la pregunta « ^Qué es lo que cambia?» tiene más de una respuesta. Por ejemplo, 
podemos observar la evolución de la intensidad de color durante la expansión. 
Podemos registrar cómo cambia la densidad, el sabor o el olor con el tiempo. 
Incluso podemos calcular el cambio en el número aproximado de partículas en 
cada compartimento. Inicialmente partimos de Aátomos en el compartimento I, 
y al abrir la portezuela o suprimir la separación, el número de átomos, », en / 
decrece continuamente con el tiempo hasta que deja de hacerlo. 
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Figura 7.5. 


La respuesta al « qué» es exactamente la misma que hemos dado en el 
capítulo anterior, a saber: lo que cambia es la configuración inespecífíca, la cual 
comporta propiedades que podemos ver, oír, oler, probar o medir con 
instrumentos macroscópicos. Así, a la pregunta « i,Qué es lo que cambia?» en el 
presente experimento puede responderse comparándolo con el juego de dados 
antes analizado. 



































La única diferencia es la interpretación del término « configuración», que 
aquí hemos definido como partículas repartidas entre dos compartimentos, / y D, 
mientras que en el caso de los dados la configuración se especificaba como dos 
resultados posibles, / y D. Una vez establecida la correspondencia entre el juego 
de dados y la expansión del gas, podemos dar la misma respuesta a la pregunta 
« í,Qué es lo que cambia?» . Más adelante volveremos a la cuestión de cuál es la 
mejor variable que describe aquello que es común a todos los procesos 
considerados. 

Ahora pasamos a la siguiente pregunta: « ^Cómo se pasa del estado inicial al 
estado final?» . En eljuego de dados prescribíamos las reglas del cambio, así que 
la respuesta a la pregunta era directa: los cambios tienen lugar conforme a las 
reglas prescritas. En lo que respecta al experimento real, la respuesta a la misma 
pregunta es diferente. En principio, la evolución de las posiciones y velocidades 
de todas las partículas se rige por las ecuaciones del movimiento. Pero en un 
sistema con gran número de partículas podemos aplicar las leyes de la 
probabilidadt^]. Podemos afirmar que si partimos de una descripción exacta 
de todas las posiciones y velocidades de todas las partículas, al poco tiempo el 
sistema perderá esa información. Debido a las colisiones aleatorias y la 
rugosidad de las paredes del recipiente, la evolución del sistema se describe más 
eficazmente mediante las leyes de la estadística que mediante las leyes de la 
mecánica^*]. 

Así pues, podemos recurrir a argumentos probabilísticos similares a los 
aplicados al juego de dados del principio. En otras palabras, hay un elemento de 
aleatoriedad que da a cada partícula una « oportunidad» de pasar de/aZ)odeZ) 
a I. Por lo tanto, la respuesta al « cómo» , aunque no exactamente, es a todos los 
efectos la misma que en el caso del juego de dados. También hemos visto que las 
reglas concretas del juego de dados no eran demasiado importantes; lo 
importante era que cada dado tuviese las mismas oportunidades de cambiar de 
manera aleatoria. Este argumento también vale para el experimento real de 
expansión de un gas: cada átomo o molécula debe tener las mismas 
oportunidades de pasar de / a D o de D a /. 

Si suprimimos el elemento de azar, entonces el sistema no evolucionará 
conforme a la segunda ley de la termodinámica. En el capítulo anterior hemos 
propuesto reglas cuya aphcación se traduce en una ausencia de cambio, o en una 
alternancia entre «todo ceros» y «todo unos» . Igualmente, podemos imaginar 
un sistema de partículas que no evolucione de acuerdo con la segunda ley. 

Considérense los dos « experimentos mentales» siguientes. Supongamos que 
todas las partículas se movieran inicialmente hacia arriba de manera concertada, 
tal como se muestra en Ia figura 7.6a. Si las paredes del recipiente fueran planos 
perfectos, sin ninguna irregularidad ni rugosidad, y exactamente perpendiculares 


a la dirección del movimiento de los átomos, entonces lo que veríamos es que las 
partículas seguirían moviéndose arriba y abajo para siempre. Incluso después de 
suprimir la separación, todas las partículas inicialmente en I permanecerán en 
ese compartimento. La segunda ley no tiene nada que hacer en un sistema 
semejante^^]. 

Un segundo « experimento mental» se ilustra en la figura 7.6b. 

Supongamos de nuevo que todas las partículas están inicialmente en I, pero 
ahora se mueven en línea recta de izquierda a derecha y de derecha a izquierda. 
Todas las particulas se mueven concertadamente y a la misma velocidad. Todas 
siguen la misma trayectoria, rebotando en la barrera y volviendo atrás. Si 
suprimimos la separación, el hazde partículas se moverá ahora concertadamente 
de I a D y de D a /, indefinidamente. En ninguno de los dos experimentos 
mentales el sistema evolucionará según los dictados de la segunda ley. En 
reahdad, un proceso de ese estilo no es factible en un experimento real. Por eso 
hemos hablado de experimento mental. 

Es evidente que las paredes de cualquier recipiente real tendrán 
imperfecciones, y aunque pudiéramos partir de un movimiento inicialmente 
sincronizado de las partículas, muy pronto las leyes probabilísticas se impondrían 
y la segunda ley comenzaria a actuar. 

Hay que decir que en termodinámica no interesa la cuestión de cómo pasa el 
sistema del estado inicial al estado final. Lo único que cuenta es la diferencia 
entre el estado inicialy eì estadofìnal. Aquí hemos mirado con lupa Ios detalles 
del movimiento de las partículas individuales para establecer la correspondencia 
entre las reglas del juego de dados y las reglas del paso de / a D o de D a I en la 
expansión del gas. Vayamos ahora a la siguiente y más importante cuestión: el 
« por qué». 
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Figura 7.6. 


Como he senalado en el capítulo anterior, la respuesta al « por qué» en el 
caso del juego de dados también es aplicable a la expansión del gas. E1 gas 
pasará de una configuración inespecífica de baja probabilidad a una 
configuración inespecífica de máxima probabilidad. Por configuración 
específica aquí se entiende una especificación detallada de cada partícula en 
cada compartimento. Una configuración inespecífica (que es lo único que 
podemos registrar) es « el número de partículas en el compartimento D». Si se 
han entendido los argumentos expuestos en los capítulos 4-6 acerca de la 
evolución del sistema del estado inicial al estado de equilibrio, entonces también 
se entenderá la evolución del sistema físico descrito en este capítulo. Hemos visto 
que con apenas 10^ o 10^ dados la probabilidad de volver al estado inicial ya es 
despreciable, y hemos concluido que, una vez que el sistema llega a la vecindad 
del estado de equilibrio, se mantiene allí « siempre» y « nunca» vuelve al estado 
inicial. E1 argumento es válido a fortiori para un sistema de 10 ^ dados o 
partículas. 

Como en el caso del juego de dados, hemos subrayado que no hay ninguna 
ley de la naturaleza que obligue al sistema a evolucionar del amarillo al verde, o 
del orden al desorden, o de menos información perdida a más información 
perdida. Todas éstas son manifestaciones observables o medidas de la evolución 
del sistema. La razón fundamental de la evolución observada del sistema es 
autoevidente: cualquier sistema siempre pasará más tiempo en estados de 





























elevada probabilidad que en estados de baja probabilidad. Cuando N es muy 

grande, digamos del orden de 10^, la « probabilidad elevada» se convierte en 
« certeza» . Ésta es la esencia de la segunda ley de la termodinámica. También 
es una ley básica del sentido común, nada más. 


La correspondencia con elproceso de desasimilación. 


A1 trazar la correspondencia entre la evolución del juego de dados y del gas 
en expansión, he completado mi misión: guiar al lector para llevarle a 
comprender el funcionamiento de la segunda ley de la termodinámica. Pero me 
gustaría trazar otra correspondencia entre el juego de dados y un experimento 
físico. Este otro caso no anadirá nada nuevo a nuestra comprensión de la segunda 
ley, pero es un ejemplo suplementario de proceso espontáneo gobernado por la 
segunda ley de la termodinámica. Mi motivación para presentarlo aquí es, más 
que nada, estética. Permítaseme explicar por qué. 

Cualquier proceso espontáneo que implique un incremento de entropía está 
gobernado por la misma ley de sentido común, a saber, que los sucesos más 
probables se darán con más frecuencia. Hemos examinado uno solo de tales 
procesos físicos, la expansión espontánea de un gas. Hay procesos más 
complicados, por supuesto, como una reacción química, la mezcla de dos 
líquidos, el desparramamiento de un huevo al caer al suelo, y muchos más. 

No siempre es fácil definir con precisión los estados del sistema sobre los que 
es operativa la segunda ley. En la ensenanza de la termodinámica es costumbre y 
resulta muy instructivo clasificar los procesos según el tipo de estados 
involucrados. Desde el punto de vista de la información o, mejor, de la 
información perdida, los procesos se subclasifican según el tipo de información 
que se pierde. En el proceso de expansión, las partículas estaban inicialmente 
confinadas en un volumen menor V. Tras la expansión, se distribuían en un 
volumen mayor 2V, por lo que resulta más « difícil» situar cada partícula, o lo 
que es lo mismo, tenemos menos información sobre las localizaciones de las 
partículas. En un proceso de transferencia de calor entre dos cuerpos a distintas 
temperaturas, el cambio en la cantidad de información es más sutil. Antes del 
proceso, las partículas del cuerpo caliente se caracterizan por una distribución de 
energías (velocidades) y las del cuerpo frío por otra. Tras ponerse en contacto y 
equilibrarse las temperaturas, tenemos una única distribución de velocidades para 
la suma de las partículas de ambos cuerpos. Volveremos a considerar este 
proceso más adelante. En procesos más complicados, como el 
desparramamiento de un huevo roto, es difícil definir los tipos de información 



perdida; puede tratarse de información sobre la localización, la velocidad, la 
orientación, entre otras variables. Unos procesos tan complejos a menudo están 
más allá de nuestra aptitud descriptiva. 

En eljuego de dados teníamos A^dados idénticos, cada uno de los cuales podía 
estar en dos (o más) estados, como «0» y « 1», o amarillo y azul, o «/» y 
«D» . En el proceso de expansión hemos hecho corresponder los dos resultados 
posibles del dado con las dos localizaciones posibles de las partículas (digamos 
átomos de argón). Esto está bien. Siempre podemos denotar un átomo en el 
compartimento de la derecha como un D-átomo, y un átomo en el 
compartimento de la izquierda como un /-átomo. Esto es formalmente correcto, 
pero estéticamente insatisfactorio, ya que la identidad inherente de los átomos no 
cambia en el proceso. En otras palabras, hemos establecido una correspondencia 
entre la identìdad del resultado del dado y la localización de la partícula. 

Permítaseme presentar un nuevo experimento gobernado por la segunda ley, 
pero donde la correspondencia entre el juego de dados y el proceso físico es más 
plausible y estéticamente más satisfactoria. Haremos corresponder la identìdad 
del resultado del dado con la identìdad de la partícula. 

E1 examen de este proceso también nos reporta un pequeno « plus» , y es que 
nos permite imaginar experimentos reales donde podemos seguir el cambio de 
color, olor o sabor a medida que el sistema evoluciona. 

Considérese una molécula con dos isómeros, digamos cis y trans, de una 
molécula, representada esquemáticamente en la figura 7.7. 

Si partimos del isómero cis puro, el sistema puede pasar mucho tiempo sin 
experimentar cambio alguno. Pero si anadimos un catalizador (lo que viene a ser 
como suprimir la separación entre compartimentos en el experimento de 
expansión de un gas), observamos un cambio espontáneo tal que la forma cis 
pura da paso a una mezcla de los isómeros cis y trans. La mecánica estadística 
proporciona un procedimiento para calcular la razón de las concentraciones de 
ambos isómeros en el equilibrio. En esta reacción en particular podemos 
identificar dos fuentes de incremento de la entropía o, equivalentemente, dos 
tipos de cambio informacional. Uno tiene que ver con la identidad molecular, 
mientras que el otro tiene que ver con la redistribución de la energía entre los 
grados de libertad internos de ambas especies moleculares. 

Hay un caso particular de reacción química donde sólo cambia la identidad 
de las moléculas (los grados de libertad internos son los mismos para ambas 
especies moleculares). Se trata de dos enantiómeros (moléculas con actividad 
óptica), isómeros que tienen la misma estructura y constitución química, sólo que 
uno es la imagen especular del otro. Un ejemplo se ilustra en la figura 7.8. 
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Denotemos estos isómeros como d y / (d por dextro y / por levo)^^. 
Ambos tienen la misma masa, el mismo momento de inercia, los mismos grados 
de libertad internos y los mismos niveles de energía. Así pues, cuando inducimos 
una « reacción» que implica la conversión de un isómero en el otro, el único 
cambio en el sistema es en el número de partículas indistinguibles. Hagamos el 
siguiente experimento: partimos de N moléculas del isómero d, y anadimos un 

catalizador que induce la transformación espontánea de d en l, o de / en í/[^ 4] 
Pues bien, se puede demostrar que, en el equilibrio, encontraremos alrededor de 
N /2 moléculas de la forma d y N/2 moléculas de la forma 1^05] También se 
puede calcular el incremento de entropía en este proceso, y se encuentra que es 
exactamente el mismo que en el proceso de expansión de antes. Pero la « fuerza 
impulsora» es diferente, y considero que la correspondencia entre el juego de 
dados y este proceso es más satisfactoria y más « natural» . 

Para verlo, tengamos en cuenta que en ambos experimentos hemos 
establecido la correspondencia: 


un dado específico <-» una partícula específíca 

En el experimento de expansión, también establecíamos la correspondencia: 
una identidad específica del resultado de un dado 

î 

una localización específica de la partícula 
En el segundo experimento, lo que se conoce como desasimilación, la 
correspondencia es: 

una identidad específica del resultado de un dado 

i 

una identidad específica de la partícula 

Así, mientras que en el proceso de expansión la evolución del estado inicial al 
estado final implica cambios en la información posicional acerca de las 
partículas, en el proceso de desasimilación tenemos un cambio en la identidad de 
las partículas^^l. Aquí la pérdida de información es del mismo tipo que la 
registrada en eljuego de dados. 

La correspondencia entre dados y partículas para este proceso se representa 
en la parte inferior de la figura 7.4. 

Tanto en el juego de dados como en el proceso de desasimilación hay una 
evolución que implica un cambio en la identidad de las partículas. En el primer 
caso partimos de N dados, todos a cero, mientras que en el experimento real 
partimos del isómero d puro. A1 cabo de un tiempo, N/2 de los dados han 
cambiado a uno, y N/2 moléculas han adquirido una nueva identidad, la forma 

][107] £ sta correspondencia es menos forzada y más natural que la establecida 
entre el juego de dados y el proceso de expansión. La evolución del sistema 
puede describirse del mismo modo que en el caso de la expansión del gas. Para 
entender la evolución de este otro experimento no hay más que cambiar D e / 
por d y /. La figura 7.9 (que es una síntesis de las figuras 7.1 y 7.3) muestra las 
tres fases del proceso de desasimilación y la correspondencia tanto con el 
experimento de expansión del gas como con el juego de dados. 

Las respuestas al « qué» y al « por qué» son las mismas que antes. La 
respuesta al « cómo», en cambio, es ligeramente distinta[^8] No obstante, 
como ya hemos senalado, la cuestión del «cómo» no es importante para 
comprender la segunda ley. Lo único que importa es la diferencia de entropía 
entre los estados inicial y final. 
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Figura 7.9. 


Y ahora el « plus» : en el capítulo 5 hemos considerado algunos procesos 
hipotétìcos donde se registraba el cambio de color, sabor u olor en un sistema de 
dados. En principio, estos procesos pueden materializarse. Supongamos que 
tenemos dos isómeros con estructuras moleculares diferentes que les confíeren 
colores, olores o sabores diferentes. Poniendo en práctica el experimento de la 
isomerización espontánea podríamos registrar el cambio de color de amarillo a 
verde (como en el prhner ejemplo del capítulo 5), o del olor A a una mezcla de 
olores^ y B (como en el segundo ejemplo), o del sabor ácido al agridulce (como 
en el tercer ejemplo). Estos cambios pueden registrarse de manera continua en 
un sistema homogéneo^^. 

Es difícil encontrar un experimento físico análogo al cambio de tono (el 
cuarto ejemplo), ya que las partículas no emiten ondas sonoras por sí solas. En 
cuanto al último ejemplo del capítulo 5, es imposible encontrar un análogo 
factìble. La temperatura es un fenómeno complejo que depende de una 
distribución continua de velocidades. Examinaremos un proceso que involucra 
cambios de temperatura en la sección 7.5. 

A estas alturas debería estar claro qué es lo que cambia (eso que llamamos 
entropía) y por qué cambia como lo hace, ya sea en el juego de dados, en el 
proceso de expansión o en el proceso de desasimilación (fígura 7.9). 
















Resumen de la evolución del sistema hacia el estado de equïlibrio. 


Volvamos al experimento simple descrito en la figura 7.2. Partimos de N = 
10 ^ partículas en I. Recordemos que una configuración específica es una lista 
detallada de qué partículas están en qué compartimentos. Una configuración 
inespecífica es una descripción de cuántas particulas hay en I y cuántas en D. 
Siempre que se mantenga la separación, no habrá cambio ni en la confíguración 
específica ni en la configuración inespecífica^ ^]. E1 sistema no evolucionará 
en el sentido de ocupar nuevos estados si éstos no son accesibles. 

Ahora supriinamos la barrera. E1 número total de estados específicos pasa a 
ser 2^, porque cada partícula puede estar o en / o en D. E1 número total de 
estados, W(total), se fíja durante el intervalo entero de tiempo que tarda el 
sistema en alcanzar el equilibrio. 

Obviamente, en cuanto se retira la barrera tienen lugar cambios observables. 
Puede ser un cambio de color, sabor, olor o densidad. Se trata de manifestaciones 
diferentes del mismo principio subyacente. Pero hay algo que cambia en todas 
estas manifestaciones. ^Qué es? 

Lo que cambia es la configuración, o estado, o suceso inespecífico y hay 
diversas maneras de asignar a estos estados un número que podemos representar 
gráficamente para seguir su evolución. ^JPor qué cambia? No porque haya una 
ley de la naturaleza que diga que los sistemas deben evolucionar del orden al 
desorden, o de una información perdida baja a una información perdida más 
alta. No es la probabïlidad de los estados inespecíficos lo que cambia (las 

probabilidades son fijas)^^]. Es el estado inespecífico mismo el que pasa de 
tener una probabilidad baja a tener una probabilidad elevada. 

Sigamos la evolución del sistema justo después de la apertura de la barrera, y 
supongamos, en aras de la simplicidad, que abrimos una compuerta lo bastante 
pequena para permitir el paso de una sola partícula en un lapso de tiempo corto. 
En el momento de abrir la compuerta, el estado inespecífico consiste en un solo 
estado específico perteneciente a la condición inmediatamente posterior a la 
apertura de la barrera (es decir, cuando hay cero partículas en D). Obviamente, 
cuando el proceso aleatorio se pone en marcha (sea el juego de dados o las 
partículas de gas colisionando con las paredes del recipiente y de vez en cuando 
atravesando el agujero) la primera partícula que pasa de un compartimento a 
otro lo hace de I a D, lo que se traduce en un nuevo estado, que llamaremos 
inespecífico-1. Como hemos analizado detalladamente en el capítulo 4, hay una 


elevada probabilidad de que el sistema se quede como está o ascienda de nivel, y 
una probabilidad muy baja de que el sistema vuelva a un estado inespecífico 
inferior. La razón es bien simple. La probabilidad de que cualquiera de las N 
partículas cruce la frontera es la misma para todas. Llamemos p\ a esa 
probabilidad (que viene determinada por la velocidad del movimiento, el tamano 
de la compuerta, etcétera). Sea cual fuere su valor, la probabilidad de pasar de 
inespecífico-1 a inespecífico-0 es la probabilidad de que la única partícula en D 
pase a 7, que no es otra que p\, mientras que la probabilidad de pasar de 
inespecífíco-1 a inespecífico-2 es ( N— 1) veces p\, simplemente porque hay (N 
- 1) partículas en I, y cada una tiene una probabilidad p\ de pasar de I a D. E1 
mismo razonamiento vale para justificar por qué será mucho más probable que 
el sistema pase de inespecífico-2 a inespecífico-3, de inespecífico-3 a 
inespecífico-4, etcétera. Cada estado inespecífico superior abarca un número 
mayor de estados específicos y, por ende, es más probable. Como hemos visto en 
los capítulos 3 y 4, esta tendencia ascendente, muy acentuada al principio, se va 
atenuando a medida que el sistema se acerca a inespecífico-M2, que es la línea 
de equilibrio. Esta línea marca el estado inespecífico más probable, ya que 
abarca el may or número de estados específicos. 

Hay que tener cuidado de no confundir el número de estados específicos 
pertenecientes a inespecífíco-M2 con el número total de estados del sistema, que 
es W(total). Este último es el total de estados específícos incluidos en todos los 
estados inespecífícos posibles. Por ejemplo, para N= 10 tenemost * 

W(total) = If(ine spe c ífic o- 0) + ^(inespecífico-1) + If(ine spe c ífic o- 2) + 

= 1 + 10+ 45+ 120 + 210 + 252 + 210+ 120 + 45+ 10+ 1 = 2 10 

Como hemos visto en los capítulos 2 y 3, la probabilidad de un suceso 
inespecífico es la suma de las probabilidades de los sucesos específicos que 
comprende. 

Por ejemplo, para N = 10, inespecífico-1 incluye 10 sucesos específícos, la 

probabilidad de cada uno de los cuales es (1/2)^. La probabilidad del suceso 
inespecífico no es más que diez veces ese número, esto es: 

Prob(inespecífico-l) = 10 x (1/2)^ 

Para inespecífico-2 tenemos 10 x 9/2 = 45 sucesos específícos, todos los 
cuales tienen la misma probabilidad de (1/2)10. Por lo tanto, la probabilidad de 
inespecífico-2 es: 


Prob(inespecífîco-2) = 45 x (1/2)^ 

En la tabla siguiente se listan las probabilidades de todos los sucesos 
inespecíficos para N = 10. Nótese una vez más que el valor máximo se sitúa en 
N/2, que en este caso es 5. 


Suceso inespecífico 

Número de sucesos específicos 

Probabilidad 

0 

1 

1/2 10 

1 

10 

10/2 10 

2 

45 

45/2 10 

3 

120 

120/2 10 

4 

210 

210/2 10 

5 

252 

252/2° 

6 

210 

210/2° 

7 

120 

120/2° 

8 

45 

45/2 0 

9 

10 

10/2° 

10 

1 

1/2 10 


La figura 7.10 muestra el número de sucesos específicos pertenecientes a 
cada suceso inespecífíco para diferentes valores de N (N = 10, N = 100 y N = 
1000), y abajo se representan los mismos datos como probabilidades de los 
sucesos inespecíficos. 

Se puede ver claramente que, a medida que iVaumenta, el número de estados 
específicos pertenecientes a los estados inespecíficos maximales también se 
acrecienta. En cambio, la probabilidad del estado inespecífico maximal decrece 
con N. Así, a medida que N aumenta, la distribución de probabilidad de los 
sucesos inespecíficos se reparte sobre un rango mayor de valores. La aparente 
agudeza de la distribución, tal como se aprecia en la parte inferior de la figura 
7.10, significa que, aunque las desviaciones del estado inespecífico maximal son 
mayores en valor absoluto cuanto mayor es N, su valor relativo disminuye a 
medida que aumenta N. 

Por ejemplo, la probabilidad de observar desviaciones de, digamos, un ±1% 
del estado inespecífico maximal se hace minúscula cuando Nes muy grande. 

Ahora calculemos la probabilidad de que el sistema se encuentre en 
cualquiera de los estados inespecífícos entre, digamos, N/2 - N /100 y Nt2 + 






N/ 100, es decir, la probabilidad de que el sistema se encuentre alrededor del 
estado inespecífico maximal, con desviaciones arriba y abajo dentro del 1% de 

N. Esta probabilidad es ya casi 1 para N= 10 000 (véase la figura 7.11). Para 
valores de N del orden de 10^, podemos permitir desviaciones del 0,1% o del 

O, 001% y seguir obteniendo una probabilidad cercana a 1 de encontrar el sistema 
en la línea de equilibrio o su vecindad. 

Lo que hemos averiguado es sumamente importante y crucial para la 
comprensión de la segunda ley de la termodinámica. La probabilidad del estado 
inespecífico maximal N/2 decrece con N: pero para valores de N muy grandes, 

del orden de 10^ o más, tenemos una certeza casi absoluta (es decir, una 
probabilidad muy cercana a 1) de que el sistema se encuentre en un estado 
inespecífico muy próximo al de equilibrio. Cuando N= 10^, podemos permitir 
desviaciones ínfimas de la línea de equilibrio, pero el sistema pasará la mayor 
parte del tiempo en los estados inespecíficos dentro de este margen estrecho en 
torno a la línea de equilibrio. 

Recordemos una vezmás que el número total de estados específicos posibles 
del sistema es 2^, y que todos tienen la misma probabilidad, de manera que cada 
uno será visitado con una frecuencia extremadamente baja, (1/2)^. En cambio, 
los estados inespecíficos (de los que hay N+ 1) son más o menos probables en 
función del número de estados específicos que abarcan. 
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Figura 7.11. 


Los estados inespecíficos en o cerca del maximal N/2 tendrán una probabilidad 
cercana a uno, es decir, casi la misma probabilidad de estar en cualquiera de los 
estados específicos totales^ 

Ya es hora de aclarar la relación entre la línea de equilibrio y el estado de 
equilibrio del sistema experimental. En el equilibrio, un sistema experhnental 
pasa una fracción de tiempo mayor en la linea de equilibrio (mayor en 
comparación con los otros estados inespecíficos). Pero no necesariamente pasa 
allí todo el tiempo. E1 estado de equilibrio experimental o termodinámico del 
sistema es el estado para el que todos los W(total) sucesos específicos son 
accesibles y tienen igual probabilidad. Pero como no podemos distinguir entre 
estados inespecíficos muy cercanos a la línea de equilibrio, el sistema pasará casi 
todo el tiempo en la vecindad de la línea de equilibrio. Aun así, habrá 
desviaciones. Las hay de dos tipos. Las desviaciones minúsculas son muy 
frecuentes, pero son inobservables. Las desviaciones grandes son observables, 
pero son tan raras que « nunca» las vemos. Por lo tanto, el estado de equilibrio 
del sistema es (casi) el mismo que el suceso inespecífico de la línea de equilibrio 
y su vecindad inmediata. 

Dada la importancia de este punto, repetiré el argumento con otras palabras. 

Consideremos el siguiente experimento. Tenemos dos compartimentos del 
mismo volumen V. Uno contiene Apartículas etiquetadas, 1, 2,..., N, y el otro 

contiene otras N partículas etiquetadas, N + 1, N + 2, ..., 2A.t^^ Ahora 



retiramos la separación entre los compartimentos. A1 cabo de un tiempo nos 
preguntamos cuál es la probabilidad de observar exactamente el estado inicial. La 

respuesta es: 2 _ ^N Luego nos preguntamos cuál es la probabilidad de observar 
exactamente N partículas en cada compartimento, etiquetas aparte. Ésta es una 

probabilidad mucho mayor^^ . Sin embargo, decrece con N, como puede 
verse en la figura 7.10. La probabilidad de observar el estado inespecífico N, 
aunque muy alta en comparación con los otros estados inespecíficos posibles, 
sigue siendo muy pequena. Lo que se observa en la práctica no es el estado 
maximal exacto, sino un grupo de estados inespecífícos en la vecindad de la línea 
de equilibrio. Esta vecindad incluye todos los estados inespecíficos 
experimentalmente indiscernibles^ 

qué podemos decir de otros procesos más complicados? Hemos 
examinado en detalle la expansión de un gas, donde elegíamos un único 
parámetro para describir la evolución del sistema, a saber, si la partícula estaba 
en/ o en D. En el experimento de desasimilación también elegíamos un único 
parámetro para describir el curso de los hechos, a saber, si la partícula estaba en 
la forma / o en la forma d. Todo lo dicho sobre el proceso de expansión puede 
trasladarse casi literalmente al proceso de desasimilación. No hay más que 
cambiar « estar en 1» o « estar en D» por « estar en la forma l» o « estar en la 
forma d». 

Por supuesto, hay procesos más complicados que involucran muchos más 
« parámetros» para describir los hechos: una molécula puede estar aquí o allá, 
puede tener esta o aquella velocidad, puede ser uno u otro isómero (o 
complementaria de moléculas mayores), etcétera. 

Para comprender la segunda ley, basta con entender un proceso, el más 
simple, el mejor. Es lo que hemos hecho. E1 principio es el mismo para todos los 
procesos; sólo difieren en los detalles. Unos son fáciles y otros más difíciles de 
describir. Algunos procesos son tan complicados que todavía no sabemos cómo 
describirlos. A veces ni siquiera sabemos cuántos parámetros están involucrados 
en el proceso. Vamos a describir brevemente algunos procesos de complejidad y 
difícultad crecientes. 


Mezcla de tres componentes. 


Supongamos que partimos de tres gases diferentes, N^ moléculas A en un 
volumen V^, Ng moléculas B en un volumen Vg y Nç moléculas C en un 
volumen Pç*(figura 7.12). 


Como antes, retiramos las separaciones entre compartimentos y observamos 
lo que ocurre. Si las moléculas tienen el mismo color, no veremos ningún 
cambio, pero podemos medir las densidades o concentraciones de cada tipo de 
molécula en cada punto y registrar los cambios. Si las moléculas tienen distintos 
colores, olores o sabores, podemos seguir la evolución del color, olor o sabor de 
la mezela después de retirar las separaciones. 

^Cómo podemos describir con un solo número aquello cuyo cambio estamos 
observando? Incluso con esta clase de experimento relativamente simple, la 
construcción del «índice» numérico (que necesitamos para registrar la 
evolución del sistema) no es un asunto sencillo. Primero tenemos que definir los 
sucesos específícos de nuestro sistema. Un suceso específico en este caso podría 
ser: « molécula 1 del tipoyf en F^, molécula 2 del tipo/í en Vg,... molécula 1 del 
tipo B en F^, molécula 2 del tipo B en Vq etcétera» . ;Una descripción 
ciertamente larga! 

Reconocemos que muchos de estos sucesos específicos nos resultan 
indistinguibles. Por ejemplo, el suceso « molécula 1 del tipo A en F 4 , molécula 2 
del tipo A en Fg, etcétera» es indistinguible del suceso específico « molécula 1 
del tipo A en F#, molécula 2 del tipo Aen F 4 , etcétera» (aquí el« etcétera» da a 
entender que el resto de la descripción es la misma en ambos casos). 



Figura 7.12. 


Los sucesos inespecíficos serán del estilo de « una molécula de A en F^, 15 
moléculas de B en F^, 20 moléculas de C en Vq etcétera» . Aquí se ignoran las 
etiquetas de las moléculas en cada compartimento; lo que importa es que haya 
una molécula A cualquiera en F 4 , 15 moléculas de B cualesquiera en Vg y 20 
moléculas de Ccualesquiera en Vq 

Hecho esto, tenemos que calcular las probabilidades de todos los sucesos 
inespecíficos. Esto no es tan fácil en el caso general. Como en el experimento de 
expansión, damos por sentado que todos los sucesos específicos tienen la misma 
probabilidad, que es 1 /W(total). Por lo tanto, podemos calcular la probabilidad de 
cada suceso inespecífíco shnplemente sumando las probabilidades de los sucesos 






específicos que comprende. Pero aquí un suceso inespecífico no viene 
determinado por un solo número, como era el caso del proceso de expansión. 
Para registrar la evolución de los sucesos inespecíficos necesitamos un número 
único. Ese número no es otro que la información perdida, el número de preguntas 
binarias que tenemos que hacer para averiguar en qué estado específico se 
encuentra el sistema, conocido el estado inespecífíco. Ese mismo número, más 
una constante que determina las unidades, es la entropía del sistema, que está 
definida para cada estado inespecífico^ Ya podemos seguir la evolución del 
sistema desde la retirada de las separaciones hasta que alcanza el estado de 
equilibrio final. Si lo hacemos, deberíamos comprobar que la información 
perdida ha aumentado en ei proceso. 


Transferencia de calor de un gas caliente a un gas frío. 


En el capítulo 5 hemos descrito un « experimento» con dados que implicaba 
cambios de temperatura. Allí decíamos que el experimento en cuestión era muy 
poco realista. Aquí examinamos un experimento real que involucra cambios de 
temperatura. Este experimento es importante por varias razones. En primer 
lugar, es uno de los procesos clásicos donde se verifica un aumento de entropía. 
De hecho, fue uno de los procesos más simples para Ios que se formuló la 
segunda ley (véase el capítulo 1). En segundo lugar, es importante poner de 
manifiesto que lo que cambia en este proceso es lo mismo que en los otros 
procesos que hemos visto: la información perdida. En tercer lugar, entenderemos 
por qué no hemos podido concebir una analogía con dados de este proceso. 

Considérese la siguiente experiencia. Inicialmente tenemos dos 
compartimentos aislados del mismo volumen y con el mismo número de 
partículas de gas, digamos argón, pero a distinta temperatura: uno a 77 = 50 K y 
otro a T2 = 400 K (figura 7.13). Si los ponemos en contacto (mediante una placa 
conductora del calor entre ambos compartimentos, o simplemente retirando la 
separación y dejando que las partículas de gas se mezelen) observaremos que la 
temperatura del gas caliente disminuye, mientras que la del gas frío aumenta. En 
el equilibrio tendremos una temperatura uniforme T = 225 ÀTen todo el sistema. 

Es evidente que se transfiere calor, o energía térmica, del gas caliente al gas 
frío. Para entender cómo cambia la entropía en este proceso necesitamos algo de 
matemáticas. Aquí intentaré ofrecer una impresión cualitativa de dicho cambio 
entrópico. 



T=400 K T=50 K T=225 K 


Figura 7.13. 


Para empezar, hay que decir que la temperatura está ligada a la distribución 
de velocidades moleculares. En la figura 7.14 se ilustra la distribución de 
velocidades de los dos gases en el estado inicial. Como puede verse, la 
distribución correspondiente al gas frío es más estrecha, mientras que la del gas 
caliente es más ancha. En el equilibrio térmico, la distribución tiene una anchura 
intermedia (la curva a trazos en la figura 7.14). 

Lo que observamos experimentabnente se interpreta al nivel molecular como 
el cambio en la distribución de velocidades moleculares. Parte de la energía 
cinética del gas caliente se transfiere al gas frío, con lo que en el equilibrio final 
se alcanza una distribución intermedia. 

Ahora fijémonos en las dos curvas de la figura 7.15, que muestra las 
distribuciones de velocidades del sistema entero antes y después del contacto 
térmico. ^Podemos decir cuál de las dos distribuciones es más ordenada o 
desordenadal ^Podemos decir en cuál de las dos distribuciones la dispersión de la 
energía cinética es más uniforme o abarca un rango más amplio de valores? 
[118] Y 0 dirja q ue i a distribución final (la curva a trazos) parece más ordenada, y 
que parece tener una dispersión menor. Obviamente, éste es un juicio altamente 
subjetivo. Por ésta y otras razones que discutiremos en el próximo capítulo, no 
me parece que la entropía pueda describirse adecuadamente ni como 
« desorden» ni como « dispersión de la energía» . En cambio, identificarla con la 
información o la información perdida sí me parece adecuado. Por desgracia, 
esto no se puede probar sin matemáticas. Me limitaré a citar un resultado 
demostrado por Shannon en 1948^ La distribución final de velocidades es la 
que tiene información mínima, o información perdida máxima. Aunque este 
resultado no puede intuirse mirando la curva, puede demostrarse 
m atem áticam ente. 







De nuevo tenemos un número único relacionado con la entropía, cuya 
evolución puede registrarse^^. 

Por último, recordemos que en el juego de dados descrito en el capítulo 5 
empleábamos dados con sólo dos estados, caliente y frío, igualmente probables. 
Para hacer el experimento más realista, deberíamos haber imaginado dados con 
un número infinito de caras (cada una correspondiente a una velocidad 
molecular). También tendríamos que haber modificado Ias reglas del juego para 
describir la evolución hacia el equilibrio (no podemos cambiar la velocidad de las 
partículas al azar, porque la energía cinética total debe conservarse). Todo esto es 
difícil de trasladar al juego de dados, por lo que uno debería guardarse de tomar 
ese modelo como algo cercano a un sistema físico real. 

En el ejemplo que nos ocupa, hemos seguido experimentalmente un 
parámetro, la temperatura. Pero la temperatura viene determinada por un 
número infinito de parámetros: todas las velocidades posibles. Por supuesto, es 
imposible registrar la velocidad de cada partícula. Lo que registramos es la 
temperatura, que es una medida de la velocidad molecular media. 




Figura 7.15. 


Pero la cosa que cambia, lo que llamamos entropía, no es más que la cantidad de 
información perdida; una cantidad que puede expresarse como la distribución de 
velocidades antes y después del contacto entre los dos gases a diferente 
temperatura. 

La « fuerza impulsora» de este proceso también es la misma que la del 
proceso de expansión y el juego de dados: el sistema procederá de un estado de 
baja probabilidad a un estado más probable. 

Cuantos más parámetros tenemos para describir los hechos, la contabilidad se 
hace más difícil. Muy pronto nos encontramos con procesos (como el que tiene 
lugar desde que un huevo cae al suelo hasta que alcanza el equilibrio, suponiendo 
que el huevo y el suelo están en una caja aislada del resto del mundo) imposibles 
de describir. En tales procesos no sólo cambia la distribución de velocidades de 
las moléculas, sino sus posiciones y sus estados internos (vibraciones, rotaciones, 
etcétera). Es virtualmente imposible describir estos cambios en detalle, y menos 
aún calcular las probabilidades de los sucesos posibles. Pero creemos que los 
principios que gobiernan los cambios que tienen lugar son los mismos que en el 
experimento de expansión simple. En principio, creemos que existe una magnitud 
llamada entropía que se describe mejor como la información perdida que 
cambia en el mismo sentido para cualquier proceso espontáneo dentro de un 
sistema aislado. En otras palabras, la segunda ley gobierna la multitud de sucesos 
que se despliega en tales procesos. 

Es tentador incluir los procesos vitales en la misma categoría de procesos 
gobernados por la segunda ley. Pero creo que, en esta fase de nuestra 




comprensión de la « vida», sería prematuro hacerlo. Es imposible describir y 
enumerar todos los « parámetros» que cambian en cualquier proceso vital. 
Personalmente pienso que los procesos vitales, como los inanimados, también 
están regidos por la segunda ley. Volveré a hablar de los procesos vitales en el 
próximo capítulo. 

Como hemos visto, el cambio puede describirse a varios « niveles» . A1 nivel 
más fundamental, lo que cambia es el estado específico, o la configuración 
específica, del sistema. En los juegos de dados, un dado concreto pasa de 2 a 4, 
por ejemplo; en el proceso de expansión, una partícula concreta pasa del 
compartimento I al compartimento D. por ejemplo, y en el proceso de 
desasimilación, una molécula concreta pasa de la forma / a la forma d. Lo que 
podemos registrar es una propiedad del estado inespecífico. Cada estado 
inespecífico abarca muchos estados específicos, entre los cuales no queremos 
distinguir (como cuando registramos sólo la suma de los resultados de Adados) o 
no podemos distinguir en principio (como cuando una partícula de gas concreta 
pasa de / a D). Lo que registramos es algo que podemos medir (temperatura, 
frecuencia de ondas electromagnéticas, densidad, etcétera) o percibir con 
nuestros sentidos (color, olor, frío o calor, etcétera). Si queremos un número o un 
índice para registrar la evolución del sistema, el mejor y más general es la 
información perdida, o su equivalente la entropía. 

^Por qué pasa un sistema de un estado inespecífico a otro? Simplemente 
porque el nuevo estado inespecífico abarca muchos más estados específícos, y 
en consecuencia es más probable. De ahí que el sistema pase una fracción de 
tiempo mayor en el estado inespecífico final. 

Por último, (,por qué cuando un sistema alcanza el estado de equilibrio se 
queda ahí « siempre» ? Simplemente porque el número de estados específicos 
pertenecientes a los estados en la vecindad de la línea de equilibrio es enorme, y 
cada uno de ellos contribuye con la misma probabilidad. 

Así pues, un sistema siempre procederá de un estado inespecífíco de baja 
probabilidad a un estado inespecífico altamente probable. Esto equivale a decir 
que los sucesos altamente probables ocurrirán con más frecuencia. Esto es de 
sentido común. Cuando el número de partículas es enorme, el número de sucesos 
elementales comprendidos por el mismo suceso inespecífico es tan grande que la 
frecuencia de los estados inespecíficos en la vecindad de la línea de equilibrio, a 
lo que nos referimos como estado de equilibrio, es prácticamente uno. Por lo 
tanto, cuando se alcanza este estado, el sistema se mantendrá « siempre» en él. 
Se trata de la misma conclusión a la que hemos llegado con el juego de dados 
descrito en el capítulo 6. 

En este punto, ya hemos adquirido una comprensión plena del porqué de la 
evolución de dos procesos: la expansión de un gas ideal y el proceso de 



desasimilación. 

Si queremos, podemos formular nuestra propia versión de la segunda ley: un 
gas ideal que ocupa un volumen inicial V siempre se expandirá espontáneamente 
para ocupar un volumen mayor, digamos 2V; si el sistema está aislado, nunca 
observaremos el proceso inverso. Es fácil probar que esta formulación es 
equivalente a las de Clausius y Kelvin (véase el capítulo 1). Para verlo, 
supongamos que nuestra formulación de la segunda ley no se cumple; esto es, a 
veces un gas que ocupa un volumen 2V se condensa espontáneamente en un 
volumen V. Si esto fuera cierto, podríamos recurrir a un truco simple para 
levantar pesos: sólo tendríamos que colocar el peso sobre el gas comprimido y 
esperar que volviera a expandirse. La contracción espontánea también podría 
servir para transferir calor de un cuerpo frío a uno caliente. E1 truco es el mismo 
que el empleado para demostrar la equivalencia de las formulaciones de Kelvin 
y de Clausius. 


Test de comprensión de la segunda ley. 


Ahora que hemos entendido la actuación de la segunda ley en los juegos de 
dados y hemos traducido el lenguaje de los dados al lenguaje de las partículas 
reales en un recipiente, es hora de que el lector se examine con el mismo diseno 
experimental que se muestra en la figura 7.2. Supongamos que nunca hemos oído 
hablar de la segunda ley, pero conocemos y aceptamos los siguientes 

supuestos^l]; 

1) La materia está constituida por gran número de átomos o 
moléculas, del orden de 10 ^. 

2) Un sistema de 10 ^ átomos de un gas ideal puede estar en 
multitud de estados específicos (o sucesos específícos, o 
configuraciones específicas) que se suponen igualmente 
probables. 

3) Todos los sucesos específicos pueden agruparse en sucesos 
inespecíficos (como Ios de la figura 7.5). 

4) Cada suceso inespecífico (excepto 0 y N) consiste en un enorme 
número de sucesos específicos indiscernibles (como los del lado 
derecho de la fígura 7.5). 

5) La probabilidad de cada suceso inespecífico es la suma de las 
probabilidades de todos los sucesos específícos que lo 
constituyen. E1 tiempo relativo que pasa el sistema en cada 


suceso inespecífîco es proporcional a su probabilidad. 

6) Hay un suceso inespecífico que contìene un número máximo de 
sucesos específicos. Por lo tanto, el sistema pasa la mayor parte 
del tìempo en este estado maximal. 

7) No podemos distinguir entre sucesos inespecíficos que difieren 
sólo en un número pequeno de partículas (digamos entre 
inespecífico-10^ e inespecífïco-10^± 1000, o entre 
inespecífico-10^ e inespecífico-10^±10^). 

E1 supuesto 7.°es esencial. En mi opinión, este supuesto (que en realidad es un 
hecho) no se destaca lo suficiente en los libros de texto de termodinámica. Sin él, 
podríamos seguir toda la construcción de la segunda ley, pero al final no 
llegaríamos a la conclusión de que la entropía debe mantenerse estrictamente 
constante en el equilibrio, y debe cambiar estrictamente en un solo sentido 
(ascendente). E1 hecho de que no observemos ningún decrecimiento de la 
entropía en el equilibrio, y sí observemos una entropía estrictamente creciente en 
un proceso espontáneo, se debe a dos razones: 

1) Hay pequenas fluctuaciones, y ocurren con mucha frecuencia, 
pero son inobservables e inconmensurables, porque son 
demasiado pequenas para poderse ver o medir. 

2) Las fluctuaciones observables y medibles no son imposibles, 
pero son tan extremadamente raras que nunca resultan 
observables ni medibles. 

Ahora formularé preguntas para que el lector las responda y luego 
compruebe si sus respuestas coinciden con las mías (entre paréntesis). 

Partimos de un sistema de N partículas (con N del orden de 10 ^) en un 
volumen V. En la figura 7.2 se muestra un sistema simphficado a modo de 
ilustración. Inicialmente, la separación entre ambos compartimentos no permite 
que las partículas crucen de un lado a otro. 

Pregunta: i,Qué observamos? 

Respuesta: (Nada; cualquier magnitud medible tendrá el mismo valor en cada 
punto del sistema, y ese valor no cambia con el tìempo). 

Luego abrimos una minúscula portezuela entre los compartimentos izquierdo 
(7) y derecho ( D ), lo bastante pequena para que sólo una partícula la atraviese 
cada cierto intervalo corto de tiempo, digamos t= 10 - ^ segundost^2] En este 


intervalo de tiempo hay una probabilidad, que denotaremos como p\ de que una 
partícula específica atraviese la portezuela. Puesto que los átomos son idénticos, 
cualquier partícula tiene la misma probabilidad p^ de pasar al otro lado. 

Pregunta: ^Cuál es la probabilidad de que alguna de las iVpartículas atraviese 

la portezuela dentro del intervalo de tiempo f! 

Respuesta: (Obviamente, dado que hemos supuesto que la portezuela es lo 
bastante pequena para que no puedan cruzarla dos partículas en el intervalo de 
tiempo t, la probabilidad de que la partícula l pase al otro lado es pl, la 
probabilidad de que la partícula 2 pase al otro lado esp\... y la probabilidad de 
que la partícula N pase al otro lado es p\. Puesto que todos estos sucesos son 
disjuntos, la probabilidad de que alguna partícula pase al otro lado es N veces p\, 
oN* Pl y. 

Pregunta: Muy bien. iQué ocurrirá en el primer intervalo de tiempo t? 

Respuesta: (O una partícula pasará de / a D, o no ocurrirá nada). Pregunta: 
Correcto. Supongamos que tenemos que esperar un intervalo t, y otro más, hasta 
que la primera partícula cruza la portezuela. 

Pregunta:^,Qué partícula será la primera en cruzar? 

Respuesta: (No sabemos cuál de las partículas cruzará la portezuela, pero sea 
cual sea, sólo puede pasar de / a D). 

Pregunta: ^Por qué? 

Respuesta: (Simplemente porque al principio no hay partículas en D, por lo 
que la primera en cruzar debe proceder de /). 

Pregunta: Correcto. Ahora esperemos hasta que la siguiente partícula 
atraviese la portezuela. 

iQ ué ocurrirá? 

Respuesta: (Dado que ahora tenemos N~ 1 partículas en / y sólo una en D, la 
probabilidad de que alguna de las N— 1 partículas que están en / pase al otro lado 
es mucho mayor que la probabilidad de que la única partícula en D vuelva a I. 
Así pues, es mucho más probable [las posibilidades son N - 1 a 1] que 
observemos el paso de una segunda partícula de / a D). 



Pregunta: Correcto. Esperemos de nuevo a que otra partícula cruce la 
portezuela. 


Pregunta:^Qué ocurrirá? 

Respuesta: (De nuevo, puesto que las posibilidades relativas de que una 
partícula pase de/aZ)y deZ)a/ son N - 2 a 2, es mucho más probable que 
veamos pasar una tercera partícula de / a D). 

Pregunta: En efecto, iy en el siguiente paso? 

Respuesta: (Lo mismo. Ahora las posibilidades de que alguna partícula pase 
de /a D son N~ 3 a 3, lo cual es algo menos que antes, pero, dado que N= 10 23 , 
las posibilidades son abrumadoramente favorables al paso de una partícula de / a 
D y no al revés). 

Pregunta: ^Qué ocurrirá en los siguientes millones, o billones, de pasos? 

Respuesta: (La respuesta vuelve a ser la misma cada vez. Si hay n particulas 
en D y N~ n partículas en /, y si n es muy pequeno en comparación con N/2, un 
millón o incluso un billón sigue siendo un número muy pequeno en comparación 
con 10 23 , así que seguirá siendo más probable el paso de una partícula de / a D 
que en sentido contrario). 

Pregunta: ^Qué pasa cuando n se hace igual (o casi igual) a N/22 

Respuesta: (Las posibilidades de pasar de / a D son aproximadamente N— n a 
n, lo que para n = N/2 significa N/2: N/2 o, equivalentemente, 1:1). 

Pregunta: qué ocurrirá? 

Respuesta: (Una cosa es lo que ocurrìrá y otra lo que veremos. Lo que 
ocurrirá es que, por término medio, pasarán tantas partículas de / a D como de D 
al. Lo que veremos es una ausencia de cambio. Si n se desvía de N/2 en unos 
cuantos miles o millones de partículas, la desviación será demasiado pequena 
para ser apreciable. Si la desviación es lo bastante grande, entonces quizá 
podríamos verla o medirla. Pero una desviación de esa magnitud es muy 
improbable, así que nunca la observaremos). 

Pregunta: Entonces, í,qué veremos o mediremos de ahí en adelante? 



Respuesta: (No habrá cambios observables o medibles; el sistema alcanzará 
un estado de equilibrio donde el número de partículas en I y el número de 
partículas en D serán aproximadamente iguales). 

Pregunta: Si las respuestas del lector han sido correctas, ha pasado el 
examen. Una pregunta más para ver si ha entendido el proceso de 
desasimilación. Supongamos que partimos de iVmoléculas, todas de la 
forma d, e introducimos una pequena porción de catalizador. Siempre que 
una molécula, cualquier molécula, tropieza con el catalizador, hay una 
probabilidad p\, de que pase de d a /o de / a d. ^Qué observaremos en este 
sistema? 

Respuesta: (Valen las mismas respuestas de antes, cambiando los 
comparthnentos I y D por los isómeros l y d. En vez de una portezuela que 
permite pasar de 1 a D y viceversa, el catalizador permite transformar d en / o / 
en d. Con esta traducción del lenguaje de los compartimentos I y D al lenguaje 
de los isómeros dyl, las respuestas son idénticas a las anteriores). 

Llegados aquí, el lector ha entendido dos ejemplos del comportamiento de la 
entropía en un proceso espontáneo. Ha pasado el examen, y yo he cumplido mi 
misión. Si tiene interés en compartir algunas de mis especulaciones personales, le 
invito a leer el próximo capítulo. 


50 % 



Fin del capítulo 7. 



8 

Reflexiones sobre el estatuto de la segunda ley de la 
termodinámica como ley física 


Si el lector me ha seguido hasta tan lejos y ha llegado a este último capítulo, 
ya debe sentirse cómodo con el concepto de entropía y con la segunda ley de la 
termodinámica. Si lanza un par de dados (reales) muchas veces, ya no debería 
sorprenderle que el valor suma = 7 aparezea más veces que cualquier otro. 
Tampoco debería sorprenderle que, si lanza un centenar de dados simplificados 
(con « 0» y « 1» como únicos resultados posibles), la suma de los resultados de 
cada dado esté casi siempre en torno a 50. Y si lanza un millón de dados 
simplificados, ya no le causará perplejidad que « nunca» obtenga suma = 0 o 
suma = 1.000.000. Sabemos que ambos resultados son posibles, pero tan 
infrecuentes que podemos pasarnos la vida entera jugando sin observarlos ni una 
sola vez. Esto ya no nos sorprende porque el sentido común nos dice que los 
sucesos altamente probables se observarán con más frecuencia, mientras que los 
sucesos con una probabilidad extremadamente baja « nunca» se observarán. 

Si uno nunca ha oído hablar de la constitución atómica de la materia y 
observa que un gas coloreado inicialmente contenido en un compartimento fluye 
hasta llenar los dos compartimentos de un recipiente, tal como se muestra en la 
figura 8.1a; o que dos compartimentos con dos gases diferentes (uno amarillo y 
otro azul, por ejemplo) se transforman en un todo de color (verde) homogéneo, 
tal como se muestra en la fïgura 8.1 b; o que un cuerpo caliente a 12 = 100 °C, 
tras entrar en contacto con un cuerpo frío a 77 = 0 °C, se enfría hasta una 
temperatura intermedia, tal como se muestra en la figura 8.1c, uno debería 
sentirse perplejo. ^Por qué fluye el gas de una cámara a otra? ^Por qué dos gases 
coloreados se transforman en una mezcla monocolor? ^Por qué las temperaturas 
del cuerpo caliente y del cuerpo frío se transforman en una única temperatura 
intermedia? ^Cuáles son las fuerzas ocultas que impulsan todos estos fenómenos, 
siempre en el mismo sentido y nunca en el opuesto? De hecho, hasta que no se 
descubrió y aceptó la naturaleza atómica de la materia^^l, todos estos 
fenómenos estuvieron envueltos en el misterio. 


« Misterio» quizá no sea la palabra adecuada. La palabra « desconcierto» 
puede que describa mejor la situación. La única razón para sentirnos 
desconcertados es que no tengamos ninguna comprensión de por qué los 
fenómenos descritos proceden en un sentido particular. Pero lo mismo vale para 
cualquier ley física. Cuando se acepta la ley como un hecho, nos parece que es 
natural y tiene sentido^-^. La segunda ley no es una excepción: el hecho de 
que tales procesos sean tan comunes y corrientes implica que progresivamente 
se vayan percibiendo como « naturales» y « con sentido» . 

Ahora bien, si sabemos que un gas consiste en un gran número de átomos o 
moléculas, del orden de 10 ^, agitándose y colisionando incesantemente millones 
de veces por segundo, entonces sabemos que las leyes de la probabilidad deben 
imponerse, y se acabó el misterio. No hay más misterio en todos esos procesos 
que en el hecho de que no nos toque el gordo en la lotería. 

Me gustaría creer que, a estas alturas, incluso quienes nunca hayan oído 
hablar de la « entropía» y la « segunda ley» antes de leer este libro se estarán 
preguntando por qué la palabra « misterio» se ha asociado con estos conceptos. 
Ya no hay motivo para inquietarse al oír la palabra « entropía» o desconcertarse 
por la « fuerza» invisible que impulsa al gas a llenar el compartimento vacío. 
Tampoco hay necesidad de seguir leyendo este libro. Mi misión de exphcar los 
« misterios de la segunda ley» se ha completado en ei capítulo anterior, donde 
hemos alcanzado una comprensión plena de la segunda ley. 



Figura 8.1. 
















En este capítulo me tomaré la libertad de exponer algunas reflexiones 
personales sobre la segunda ley. Algunas de mis ideas no cuentan con un respaldo 
universal. Aun así, me he aventurado a expresarlas y arriesgarme a suscitar la 
crítica de científicos cuyo parecer puede ser diferente y más correcto que el 
mío. 

En este capítulo planteo algunas preguntas e intento contestarlas. Comenzaré 
con una relativamente inocente: ^por qué la segunda ley ha estado rodeada de 
misterio durante tanto tiempo? ^Es porque contiene una semilla de conflicto entre 
la simetría temporal de las ecuaciones del movimiento y la irreversibilidad 
observada de los procesos naturales? Luego discutiré unas cuantas preguntas más, 
cuyas respuestas todavía son objeto de controversia. ^Es realmente la entropía 
una medida del « desorden» , y qué significa el orden o desorden de un sistema? 
^Cómo ha invadido la «información» un «territorio» que solía albergar sólo 
entidades físicamente medibles? ^Está la segunda ley íntimamente asociada con 
la flecha del tiempo? ^Cuál es el «estatuto» de la segunda ley de la 
termodinámica en comparación con otras leyes de la naturaleza? ^JEs también 
posible que algún día la ciencia prescinda de la segunda ley de la termodinámica 
al considerarla una redundancia, una reliquia de la visión preatomista de la 
materia que no enriquece nuestro conocimiento del funcionamiento de la 
naturaleza? 


lCuál es la fuente delmisterio? 


En mi opinión, hay varias razones que dan pie al misterio que envuelve la 
segunda ley. La primera, y tal vez la más simple, es la propia palabra 
«entropía» . Todo el mundo está familiarizado con conceptos como fuerza, 
trabajo, energía y demás. Cuando uno estudia física, encuentra las mismas 
palabras, aunque a veces con un significado bien diferente del ordinario. La 
cantidad de «trabajo» que me ha llevado escribir este libro no se mide en las 
mismas unidades de trabajo (o energía) que se usan en física. Igualmente, la 
« fuerza» ejercida sobre un político para que impulse un proyecto de ley no es la 
clase de fuerza que maneja la física. No obstante, Ios conceptos precisos de 
trabajo y fuerza tal como los define la física retienen algo del aire cualitativo de 
su significado cotidiano. Por eso no es difícil acomodarse al significado nuevo y 
más preciso conferido por la física a conceptos familiares como fuerza, energía 
o trabajo. En cambio, cuando uno tiene su primer encuentro con un neologismo 
como « entropía» , levanta un aire de misterio que tiene un efecto extrano e 
incómodo. Si uno no es estudiante de física o química y por casualidad oye 
hablar de « entropía» a los científicos, le parecerá que ese concepto está más 



allá de su alcance, y más aún si los propios científicos se refieren a la entropía 
como un misterio. 

León Cooper (1968), justo después de citar la explicación de Clausius de sus 
razones para la elección del término « entropía» , comenta[^5] ; 

A1 hacerlo así, en vez de extraer un nombre del cuerpo del lenguaje 
corriente (digamos « calor perdido»), consiguió acunar una palabra que 
significaba lo mismo para todo el mundo: « nada» . 

En líneas generales estoy de acuerdo con este comentario de Cooper, pero 
tengo dos objeciones. En primer Iugar, la palabra «entropía» es 
desafortunadamente enganosa, lo cual no quiere decir que carezca de 
significado. Abramos un diccionario y leeremos: « Entropía, del griego antiguo, 
cambio, giro literario». Es evidente que el concepto de entropía no se 
corresponde con « transformación» , ni « cambio» , ni « giro» . Como hemos 
visto, la entropía, tal como se define tanto en la formulación no atomista como en 
la formulación atomista de la segunda ley, es algo que cambia. Pero no es la 
« transformación» lo que se transforma, no es el « cambio» lo que cambia, y 
desde luego no es ningún « giro» lo que evoluciona. 

Mi segunda objeción tiene que ver con la sugerencia casual de Cooper de que 
«calor perdido» podría haber sido una denominación más apropiada. 
Ciertamente, «calor perdido» tiene más sentido que «entropía» . También 
concuerda con el significado universal atribuido a la entropía como « medida de 
la energía no disponible» ^26] Volveré a este significado de la entropía en la 
sección « La asociación de la entropía con la información perdida» . 

Hay una segunda razón para la aureola de misterio de la entropía, aparte de 
que sea un concepto con el que no estamos familiarizados. E1 hecho mismo de 
que tantos autores digan que la entropía es misteriosa la convierte en misteriosa. 
Esto se aplica tanto a divulgadores de la ciencia como a autores de libros de texto 
de termodinámica. 

Un ejemplo lo brinda un libro muy reciente para el gran público 
brillantemente escrito por Brian Greene, donde podemos leer^?]; 

Y entre las características de la experiencia común que se han resistido a 
la explicación completa está una que se adentra en uno de los misterios no 
resueltos más profundos de la física moderna, lo que el gran físico 
británico Sir Arthur Eddington llamó « la flecha del tiempo» . 


Acontinuación, Greene explica el comportamiento de la entropía recurriendo 


a las páginas de Guerray paz, la novela épica de Tolstói. Hay muchas maneras 
de desordenar las páginas de la citada novela, pero sólo una (o dos) de ponerlas 
en el orden correcto. 

Amí me parece que la cita anterior contribuye a perpetuar un misterio que 
ya no existe. Con unas cuantas frases más, Greene podría haber explicado 
fácilmente la « entropía», igual que ha explicado tantos otros conceptos de la 
física moderna. Por eso me extrana que diga que es « uno de los misterios no 
resueltos más profundos de la física moderna», cuando lo que debería haber 
escrito es que el misterio que envolvía la segunda ley ya es historia. Hay muchos 
autores que han escrito sobre la segunda ley con la intención de explicarla, pero 

que de hecho han acabado perpetuando el misteriot^] 

Un ejemplo clásico es el libro de Atkins, La segunda ley, que comienza con 
las siguientes palabras^ * 29]. 

Ninguna otra parte de la ciencia ha contribuido tanto a la liberación del 
espíritu humano como la segunda ley de la termodinámica. Pero, al 
mismo tiempo, pocos sectores de la ciencia se han mantenido tan 
recónditos. La sola mención de la segunda ley suscita visiones de pesados 
motores de vapor, matemáticas intrincadas, y una infínitamente 
incomprensible entropía. 

i,Cómo debemos interpretar estas tres frases? Por mi parte, no estoy en 
absoluto de acuerdo con ninguna de ellas. La prhnera frase es ambigua. No 
acabo de entender qué tiene que ver la segunda ley con «la liberación del 
espíritu humano» . Pero lo que pretendo aquí no es discutir las opiniones de Atldns 
sobre la segunda ley. Si cito las tres frases que abren el libro de Atidns es para 
mostrar cómo contribuyen a perpetuar el misterio. La primera suscita grandes 
expectativas, y presumiblemente nos anima a leer el libro. Pero estas 
expectativas se ven en gran medida frustradas a medida que vamos Ieyendo. Las 
otras dos frases son manifiestamente descorazonadoras (una entropía 
« infinitamente incomprensible» no estimula precisamente el apetito a la hora de 
hincarle el diente). En muchos libros de texto de termodinámica, los autores 
dedican mucho tiempo a examinar diferentes manifestaciones de la segunda ley, 
pero muy poco a lo que tienen en común todas esas manifestaciones. En vez de 
seleccionar uno o dos ejemplos simples de procesos que constituyen 
manifestaciones de la segunda ley, se presenta un cúmulo de ejemplos, algunos 
demasiado complicados para que resulten comprensibles. Leyendo todo eso, uno 
es incapaz de ver el bosque a través de los árbolesl- ^0] 

En el capítulo 7 hemos examinado dos ejemplos relativamente simples que 


ponen de manifiesto la actuación de la segunda ley. En ambos casos sólo 
cambiaba un parámetro. En el primer ejemplo observábamos un cambio en la 
información posicional (partículas inicialmente confinadas en un volumen dado 
se dispersan y ocupan un volumen mayor). En el segundo ejemplo lo que 
cambiaba era la identidad de las partículas. En el experimento de la transferencia 
de calor de un cuerpo caliente a otro frío lo que cambiaba era la distribución de 
velocidades. Por supuesto, hay procesos más complicados que implican cambios 
en numerosos parámetros (o grados de libertad). A veces es difícil enumerarlos 
todos. Por ejemplo, los procesos implicados en la rotura de un huevo al caer al 
suelo implican cambios de posición, de identidad, de distribución de velocidades, 
de orientaciones y de rotaciones internas de las moléculas. Todo esto complica la 
descripción del proceso, pero el principio de la segunda ley es el mismo. Para 
entenderlo basta con fijarse en un proceso simple, y cuanto más simple mejor y 
más fácil de entender. 

E1 libro de Atldns dedica un capítulo entero a « ver cómo la segunda ley da 
cuenta de la emergencia de las formas intrincadamente ordenadas 
característícas de la vida» En mi opinión, esta promesa no se cumple. He 

Ieído el libro de Atldns de cabo a rabo y no he conseguido ver « cómo la segunda 
Iey da cuenta de la emergencia de las formas intrincadamente ordenadas 
característícas de la vida» . 

Las promesas de esta clase contribuyen a la frustración de los lectores y les 
disuaden de esforzarse en comprender la segunda Iey. 

Los fenómenos de la vida involucran procesos extremadamente complicados. 
Todo el mundo, científicos y no científicos, « sabe» que la vida es un fenómeno 
complejo, muchos de cuyos aspectos, incluida la mente y la conciencia, todavía 
no se comprenden bien. Así pues, hablar de la vida en un libro que se supone que 
explica la segunda ley deja al lector con Ia impresión de que la entropía, como la 
vida, es descorazonadoramente difícil de entender y muy misteriosa. 

Es cierto que muchos científicos creen que todos los aspectos de la vida, 
incluida Ia conciencia, están sometidos en última instancia a las leyes de la física 
y Ia química, y que no hay ninguna entidad separada, como la mente, que no 
sucumba a dichas leyes. Personalmente también pienso así. Pero este argumento 
está lejos de haber sido probado y comprendido. Podría ser que algunos aspectos 
de la vida requieran una extensión de las Ieyes de la física y la química hoy 
conocidas, como ha sido sugerido Iúcidamente por Penroset'-^] En mi opinión, 
por lo tanto, es prematuro tratar la vida como cualquier otro ejemplo de proceso 
termodinámico, por fascinante que sea, en el contexto de Ia explicación de la 
segunda ley. 

E1 misterio asociado a la entropía obedece también a otras razones más 
profundas. Durante más de un siglo, la segunda ley estuvo formulada en términos 


puramente termodinámicos, e incluso tras el advenimiento de la teoría molecular 
de la materia se siguió ensenando como una ley termodinámica, en términos 
macroscópicos. Este enfoque conduce inevitablemente a un callejón sin salida. 
De hecho, como proclamó (correctamente) mi prhnera profesora de 
termodinámica (véase el prefacio), no hay esperanza de comprender la segunda 
ley dentro del marco de la termodinámica. Para ver la luz, debemos recorrer los 
túneles de la termodinámica estadística, esto es, la formulación de la segunda ley 
sobre la base de un número inmenso de partículas indistinguibles. Si examinamos 
las diferentes formulaciones de la segunda ley dentro de la termodinámica 
clásica, se puede demostrar su equivalencia mutua. Se puede demostrar que la 
entropía que induce un proceso tal como la expansión de un gas es la misma que 
induce otro proceso tal como la mezcla de dos gases distintos. Algo más difícil es 
demostrar que también es la misma entropía que induce una reacción química, o 
la mezela de dos líquidos. Y es imposible demostrar que es la misma entropía 
responsable del estropicio creado por el reventón de un huevo (aunque damos por 
sentado que sí es la misma, y que algún día, cuando el aparato matemático de la 
termodinámica estadística sea más poderoso, seremos capaces de demostrarlo). 
Pero, con independencia de cuántos procesos espontáneos desentranemos y 
podamos atribuir al inexorable incremento de entropía, al fínal nos 
encontraremos en un callejón sin salida. Nunca entenderemos cuál es la fuente 
subyacente de este ascenso irreversible de la entropía. La termodinámica no nos 
revela los sucesos moleculares subyacentes. 

De no haberse descubierto y aceptado la naturaleza atómica de la 
materiat^], nunca habríamos podido explicar la segunda ley, y ésta habría 
permanecido para siempre en el misterio. 

Ésa era la situación a finales del sigloXIX y comienzos del XX. Aunque la 
teoría cinética del calor había conseguido explicar la presión, la temperatura e 
incluso Ia entropía en términos de los movimientos de átomos y moléculas, estas 
explicaciones se consideraban meras hipótesis. Científicos importantes e 
influyentes como Ostwald y Mach pensaban que el concepto de átomo, y las 
teorías basadas en su existencia, no deberían formar parte de la física. Su 
argumento era que, dado que nadie había « visto» los átomos de manera directa 
ni indirecta, su incorporación a cualquier teoría de la materia debía considerarse 
puramente especulativa. 

La situación cambió drásticamente a comienzos del sigloXX. Fue Einstein 
quien contribuyó decisivamente a la derrota del éter y preparó el camino para la 
victoria de los atomistas. La aceptación de la interpretación molecular de la 
entropía de Boltzmann se hizo inevitable (véase el capítulo 1). 

Pero el abrazo de la interpretación de Boltzmann no disipó el misterio. Se 
había abierto de par en par la puerta hacia una comprensión plena de la 
naturaleza de la entropía, a pesar de lo cual el misterio persistió. ^Por qué? 


No estoy seguro de conocer la respuesta a esta pregunta. Pero sé, por 
experiencia propia, por qué el misterio ha estado flotando en el aire durante tanto 
tiempo. La razón tiene que ver, creo, con la controversia no resuelta suscitada por 
la asociación de la entropía con el « desorden» , con la « información perdida» y 
con la «flecha del tiempo» . Examinaré cada una de estas cuestiones por 
separado. 


La asociación de la entropía con el «desorden». 


La asociación de la entropía con el desorden quizá sea la más antigua de las 
tres, pues hunde sus raíces en la interpretación de Boltzmann de la entropía. Los 
conceptos de orden y desorden son vagos y altamente subjetivos, y aunque es 
cierto que en muchos casos se puede correlacionar el incremento de entropía con 
un incremento del desorden, decir que « el proceder de la naturaleza es ir del 
orden al desorden» es lo mismo que decir que « el proceder de la naturaleza es ir 
de una entropía baja a una entropía elevada» . Esto no explica el aumento del 
desorden en un proceso espontáneo. No hay ninguna ley de la naturaleza que 
imponga que los sistemas tienen que evolucionar del orden al desorden. 

De hecho, no es cierto que un sistema evolucione siempre del orden al 
desorden. Si rechazo la identificación de la entropía con el desorden es, más que 
nada, porque orden y desorden son conceptos mal definidos y muy borrosos. Son 
demasiado subjetivos, a veces ambiguos y en ocasiones totalmente enganosos. 
Consideremos los siguientes ejemplos: 

En la figura 8.2 tenemos tres sistemas. A la izquierda tenemos N átomos de 
gas en un volumen V. En el centro, una parte de los N átomos ocupa un volumen 
2 V. A la derecha, los N átomos se han distribuido uniformemente por todo el 
volumen 2 V. Fijémonos bien. ^Alguien puede decir cuál de los tres sistemas es el 
más ordenado? Se podría argumentar que el sistema de la izquierda, donde los N 
átomos están confinados en la mitad del volumen disponible, está más ordenado 
que el de la derecha, donde los átomos están dispersos por el volumen entero. 
Esto es plausible cuando la entropía se asocia con la información perdida (véase 
más adelante) pero, en lo que respecta al orden, personalmente no veo que 
ninguno de los sistemas de la figura esté más ordenado o desordenado que el 
resto. 

Ahora consideremos los dos sistemas representados en la figura 8.3. En el 
sistema de la izquierda tenemos iVpartículas azules en una caja de volumen V, y 
Apartículas rojas en otra caja del mismo volumen. A la derecha tenemos todos 
los átomos mezclados dentro del mismo volumen V. ^Cuál de los sistemas está 



más ordenado? Ami juicio, el sistema de la izquierda está más ordenado, porque 
las partículas azules y las rojas están en cajas separadas, mientras que en el 
sistema de la derecha están mezcladas. « Mezclado» es, desde Iuego, un estado 
desordenado, coloquialmente hablando. De hecho, el mismo Gibbs describió la 
entropía como «grado de mezcla» . Pero se puede demostrar que los dos 
sistemas mencionados tienen igual entropía. Así pues, la asociación de la mezcla 
con el incremento del desorden y, por ende, de entropía no es más que una 
ilusión. EI problema con los conceptos de orden y desorden es que no están bien 
definidos (el « orden» , como la « estructura» y la « belleza» , está en los ojos del 
observador). 

No conozco ninguna definición precisa de orden y desorden que pueda servir 
para validar la interpretación de la entropía como una medida de desorden. Aun 
así, Callen (1985), en su conocido libro de termodinámica, escribe (pág. 380): 



Figura 8.2. 
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• • • 


Figura 8.3. 


De hecho, el marco conceptual de la « teoría de la información» erigido 
por Claude Shannon a finales de los cuarenta proporciona una base para la 
interpretación de la entropía en términos de la medida del desorden de 
Shannon. 















Y en la página siguiente Callen concluye: 


Para un sistema cerrado la entropía se corresponde con la medida 
cuantitativa de Shannon del máxhno desorden posible en la distribución 
del sistema entre sus microestados permisibles. 

He ensenado termodinámica durante muchos anos, y a menudo me he 
basado en el libro de Callen. Es un texto excelente. Pero, con el debido respeto a 
Callen y su libro, debo decir que los pasajes citados confunden al lector. He leído 
concienzudamente el artículo de Shannon «The Mathematical Theory of 
Communication», palabra por palabra y de cabo a rabo, y en ninguna parte he 
visto que Shannon defína o haga referencia al « desorden» . Creo que Callen 
tergiversa a Shannon en los pasajes citados y en el resto de ese capítulo de su 
Iibro. ^Para qué? Pues para « legitimizar» el recurso al concepto de desorden en 
la interpretación de Ia entropía. Esto no se corresponde con Io que escribe 
Shannon. Lo que Callen dice que es una definición de desorden en realidad es la 
definición de información de Shannon. En mi opinión, la redefinición de la 
información como desorden por parte de Callen no contribuye a la comprensión 
de la entropía. Como hemos visto en los capítulos 2 y 6, la concepción cualitativa 
y altamente subjetiva de Ia información se ha transformado, por obra de 
Shannon, en una medida cuantitativa y objetiva. Como también hemos visto, el 
concepto de información así destilado retiene el significado ordinario de la 
palabra « información» . No ocurre lo mismo con el desorden. Por supuesto, uno 
puede definirlo como hace Callen, recurriendo precisamente a la definición de 
información de Shannon. Pero, por desgracia, esta definición de « desorden» no 
tiene en general el mismo significado que tiene en el lenguaje ordinario, como 
demuestran Ios ejemplos anteriorest 

Para concluir esta sección, yo diría que el incremento del desorden (o 
cualquier término equivalente) puede asociarse a veces, pero no siempre, con el 
incremento de la entropía. Por otro lado, la « información» siempre puede 
asociarse con la entropía, lo que la hace superior al desorden. 


La asociación de la entropía con la información perdida. 


Desde que Shannon propuso su definición del concepto de información, ésta 
se ha demostrado muy adecuada para la interpretación de la entropíat^-’l. En 
mi opinión, el concepto de información perdida no sólo ha contribuido a nuestra 


comprensión de la cosa que cambia (eso que llamamos entropía), sino que 
también nos ha acercado más al paso final de entender el comportamiento de la 
entropía como algo de sentido común. Pero esta opinión no es universal. 

Sobre esta cuestión, Callen (1983, pág. 384) escribe: « Hay una escuela de 
termodinámica que contempla la disciplina como una ciencia de predicción 
subj etiva». 

En un párrafo ya citado, anterior a los pasajes donde identifíca la entropía 
con el desorden, Callen escribe: 

E1 concepto de probabilidad tiene dos interpretaciones distintas en el uso 
corriente. La « probabilidad objetiva» se refíere a una frecuencia, o una 
ocurrencia fraccionaria; la afírmación de que « la probabilidad de que un 
recién nacido sea varón es algo menor que una mitad» es un enunciado 
sobre datos censales. La « probabilidad subjetiva» es una medida de una 
expectativa basada en una información subóptima. La evaluación por 
parte de un médico de la probabilidad (subjetiva) de que una criatura aún 
no nacida sea varón depende del conocimiento que tiene el médico de las 
historias familiares de los progenitores, de los datos acumulados sobre 
niveles hormonales maternos, de la claridad creciente de las imágenes 
por ultrasonidos y, finalmente, de una estimación bien informada, pero 
que sigue siendo subjetiva. 

Como he explicado en el capítulo 2 (en la sección «Probabilidad 
condicionada y probabilidad subjetiva»), discrepo de Callen en un sentido 
fundamental. Los dos ejemplos de Callen pueden ser objetivos o subjetivos según 
la condición dada o el conocimiento relevante que se tiene. 

He vuelto a citar este párrafo del libro de Callen para mostrar que su 
argumento en pro del « desorden» es esencialmente falaz. Creo que Callen ha 
aplicado equivocadamente el argumento probabilístico para tachar la 
información de «subjetiva» y defender la identificación de la entropía con el 
desorden, que para él es « obj etivo» . 

Un visitante extraterrestre que no tenga información sobre el censo de recién 
nacidos no tendría ni idea de las probabilidades de ser nino o nina, y su asignación 
de dichas probabilidades sería totalmente subjetiva. Por otro lado, si dispusiera de 
la misma información y el mismo conocimiento, incluyendo las frecuencias de 
ninos y ninas, y unas estadísticas hospitalarias fiables, su asignación de 
probabilidades sería inevitablemente objetiva. 

Es desafortunado, y hasta irónico, que Callen descarte la « información» por 
subjetiva, y al mismo tiempo recurra a la definición de Shannon de la 
información, pero rebautizándola como « desorden» . A1 hacer esto sustituye una 



magnitud bien definida, cuantitativa y objetiva por el más subjetivo concepto de 
desorden. Si Callen no se hubiera servido de la definición de Shannon, el desorden 
habría seguido siendo una magnitud mal defínida, cualitativa y altamente 
subjetiva. 

A mi modo de ver, la cuestión no es si la información o el desorden son 
conceptos objetivos o subjetivos. Lo que importa es que las nociones de orden y 
desorden no son conceptos científícamente bien definidos. La información, en 
cambio, sí es una magnitud científicamente bien definida, tanto como un punto o 
una línea en geometría, o la masa o la carga de una partícula en física. 

En su Iibro Elfin de las certidumbres, Ilya Prigogine (1997) cita las siguientes 
palabras de Murray Gell-Mann (1994): 

Entropía e información están estrechamente relacionadas. De hecho, la 
entropía puede verse como una medida de ignorancia. Cuando sólo se 
sabe que un sistema está en cierto macroestado, la entropía de dicho 
macroestado mide el grado de ignorancia del microestado en el que se 
encuentra, contando el número de bits de información adicional que se 
requieren para especifícarlo, con todos los microestados tratados como 
igualmente probables^^]. 

Estoy completamente de acuerdo con Gell-Mann, pero Prigogine hace esta 
crítica: 

Creo que este argumento es insostenible, porque imphca que es nuestra 
propia ignorancia, nuestra imprecisión, lo que lleva a la segunda ley. 

Jnsostenible? ^Por qué? La razón de que dos premios Nobel tengan visiones 
diametralmente opuestas de la entropía reside en una comprensión deficiente del 
concepto de información. 

En mi opinión, Gell-Mann no sólo tiene razón, sino que se cuida de decir que 
« la entropía puede verse como una medida de ignorancia... La entropía... mide 
el grado de ignorancia» . No dice nuestra propia ignorancia, como entiende 
equivocadamente Prigogine. 

En efecto, como hemos visto en el capítulo 2, la información es una medida 
que está ahí en el sistema (o en el juego del capítulo 2). Dentro de la « teoría de 
la información», la magnitud «información» no tiene nada de subjetiva. 
Gell-Mann emplea el término «ignorancia» como sinónimo de «falta de 
información» . Como tal, la ignorancia también es una magnitud objetiva que 
pertenece al sistema, y que no es lo mismo que nuestra ignorancia, que puede ser 
objetiva o subjetiva. 


Este malentendido de la interpretación informacional de la entropía como 
concepto subjetivo es bastante corriente. Citaré otro párrafo del prefacio del libro 
de Atldns, La segunda /ejy[^7] ; 

He omitido deliberadamente cualquier referencia a la relación entre 
teoría de la información y entropía. Existe el peligro, me parece a mí, de 
dar la impresión de que la entropía requiere la existencia de alguna 
entidad cognoscitiva capaz de poseer «información» o de ser 
«ignorante» en cierto grado. De ahí a la presunción de que la entropía 
está en la mente y, por ende, es un aspecto del observador, sólo hay un 
pequeno paso. 

E1 rechazo de Atldns de la interpretación informacional de la entropía sobre la 
base de que esta « analogía» conduciría a la « presunción de que la entropía está 
en la mente» es irónico. En lugar de hablar de información, emplea los términos 
« desorden» , « desorganizado» y otros, que a mi juicio están mucho más « en la 
mente» . 

E1 caso es que entropía e información no sólo son conceptos « análogos» , sino 
que pueden hacerse idénticos. 

Vuelvo a insistir en que la interpretación de la entropía como una medida de 
información no puede servir para explicar la segunda ley de la termodinámica. 
La afirmación de que la entropía es una magnitud siempre creciente en cualquier 
proceso espontáneo (dentro de un sistema aislado) no se explica diciendo que es 
« el modo que tiene la naturaleza de incrementar el desorden» o « el modo que 
tiene la naturaleza de incrementar la ignorancia». Éstas son descripciones 
posibles de la cosa que cambia en un proceso espontáneo. Como descripción, el 
término « información» es aún más apropiado que « entropía» a la hora de 
denotar lo que cambia. 

Antes de acabar esta sección, hay que mencionar un problema persistente 
que ha obstaculizado la aceptación de la interpretación informacional de la 
entropía. Recordemos que la entropía se definió como calor dividido por 
temperatura. Como tal, tiene unidades de energía dividida por temperatura. Estos 
dos conceptos son tangibles, medibles y están bien definidos. Entonces, ^de qué 
manera la « información» , que es una magnitud adimensional^-^, un número 
que no tiene nada que ver ni con la energía ni con la temperatura, puede 
asociarse con la entropía, una magnitud definida sobre la base de la energía y la 
temperatura? Creo que ésta es una objeción muy válida que merece un examen 
más detenido. De hecho, el mismo Shannon reconoció que su medida de la 
información sólo se puede identìficar con la entropía si se multìplica por una 


constante k (ahora conocida como la constante de Boltzmann) que tiene unidades 
de energía dividida por temperatura. Esto en sí mismo no contribuye demasiado 
a probar que dos conceptos aparentemente muy distintos son en realidad 
idénticos. Pero creo que hay una razón más profunda para la dificultad de dicha 
identificación. Me explayaré sobre esta cuestión a dos niveles. 

En primer lugar, nótese que, en el proceso representado en la figura 8.1c, el 
cambio de entropía implica una cantidad de calor transferido, además de una 
diferencia de temperatura inicial. Pero esto es sólo un ejemplo de proceso 
espontáneo. Considérese la expansión de un gas ideal representada en la figura 
8.1a, o la mezcla de dos gases ideales representada en la figura 8.1b. La entropía 
aumenta en ambos casos. Pero, también en ambos casos, no hay cambio de 
energía, ni transferencia de calor, ni la temperatura tiene nada que ver. Si 
llevamos a cabo estos dos procesos en condiciones de aislamiento, entonces el 
cambio de entropía será independiente de la temperatura, y obviamente no habrá 
ninguna transferencia de calor de un cuerpo a otro. Estos ejemplos sugieren que 
el cambio de entropía no necesariamente tiene que ver con la energía y la 
temperatura. 

E1 segundo punto quizá pertenezea a un nivel más profundo. Las unidades de 
entropía (Joule/Kelvin) no sólo son innecesarias, sino que la entropía no deberia 
venir expresada en función de dichas unidades. La inclusión de la energía y la 
temperatura en la defmición original de la entropía es un accidente histórico, una 
reminiscencia de la era preatomista de la termodinámica. 

Recordemos que la temperatura se definió antes que la entropía y antes que 
la teoría cinética del calor. Kelvin introdujo la escala absoluta de temperatura en 
1854, y Maxwell publicó su artículo sobre la distribución de velocidades 
moleculares en 1859. Esto condujo a la identificación de la temperatura con la 

energía cinética media de los átomos o moléculas del gas de turno^^] Una vez 
confirmada y aceptada esta identificación de la temperatura como una medida 
de la energía cinética media de los átomos, ya no había razón para mantener las 
viejas unidades de temperatura. Había que redefinir la temperatura absoluta, 
denotada provisionalmente por T, como T = kT. La nueva temperatura T tendría 
unidades de energía, así que la constante de Boltzmann í ya no sería 
necesaria^^. La ecuación de la entropía sería simplemente S = ln W, jy la 
entropía sería una magnitud adimensionalît^l] 

Si la teoría cinética de los gases hubiera sido anterior a Carnot, Clausius y 
Kelvin, el cambio de entropía se habría definido igualmente como energía 
dividida por temperatura, pero esta razón habría sido adimensional. Esto no sólo 
simplifica la fórmula de la entropía de Boltzmann, sino que facihta la 
identificación de la entropía termodinámica con la información de Shannon. 


Como escribió G. N. Lewis (1930): «Una ganancia de entropía siempre 
significa una pérdida de información, y nada más» . 

Esta afirmación casi profética se hizo dieciocho anos antes de que naciera la 
teoría de la información, y deja bien claro que Lewis consideraba que entropía e 
información son conceptualmente idénticas. 

Shannon (1948) demostró que la entropía es formalmente idéntica a la 
información. Se dice que John von Neumann aconsejó a Claude Shannon que 
empleara el término « entropía» para referirse a la información, porque^^: 
« Nadie sabe lo que es la entropía en realidad, así que en cualquier debate 
siempre estarás en ventaja» . 

Sin entrar en la controversia sobre la objetividad o subjetividad de la 
información, sea como fuere, creo que la entropía puede identificarse, 
conceptual y formalmente, con la información. La identificación de ambas se 

consigue redefiniendo la temperatura como unidades de energía[^3] Esto 
elimina automáticamente la constante de Boltzmann del vocabulario de la física, 
lo que simplifica la fórmula de Boltzmann para la entropía y nos libera de la 
pesada losa que ha dificultado la interpretación de la entropía como información 
durante más de un siglo. Ya es tiempo también de cambiar no sólo las unidades 
de entropía para convertirla en una magnitud adimensional^^, sino la propia 
palabra «entropía». Como ahora se reconoce, entropía no significa 
« transformación» , « cambio» o « giro» . Significa « información» . ^Por qué no 
prescindir de un término que no significa « nada», como senaló Cooper, y ni 
siquiera transmite el significado que pretendía transmitir Clausius al elegirlo? ^Por 
qué no sustituirlo por un vocablo más simple, familiar, con más sentido y mejor 
definido como es « información» ? Esto no sólo disiparía buena parte del misterio 
asociado a la extrana palabra « entropía» , sino que facilitaría la aceptación de la 
sugerencia de John Wheeler de « contemplar el mundo físico como hecho de 
información, con la energía y la materia como incidentes» 1 145] 

Antes de concluir esta sección, debo dar una justificación de mi segunda 
objeción al comentario de Cooper citado en la página 197. 

Estoy de acuerdo en que « calor perdido» sería preferible a « entropía» . 
Pero tanto la expresión «calor perdido» como la expresión «energía no 
disponible» se aplican a TAS (el producto de la temperatura y el incremento de 
entropía) y no al cambio de entropía en sí. La asociación frecuente de la entropía 
con el« calor perdido» o la « energía no disponible» se debe a que es la entropía 
la que aporta la unidad de energía. Pero si uno define la temperatura como 
unidades de energía, entonces la entropía se hace adimensional. Así pues, al 
formar el producto TAS, ahora es la temperatura la que aporta la unidad de 
energía. Esto facilitaría la interpretación de TAS (y no el incremento de entropía) 


como « calor perdido» o « energía no disponible» . 

También quiero anadir un último comentario sobre nomenclatura. Brillouin 
(1962) ha propuesto la palabra « neguentropía» en vezde « información» . Pero 
esto equivale a cambiar un término shnple, familiar e informativo por otro más 
vago y esencialmente enganoso. Por mi parte, yo sugeriría sustituir la palabra 
entropía por « neguinformación» , « información perdida» o « incertidumbre» . 

Por último, hay que decir que, aunque identifiquemos la entropía con la 
información, hay una diferencia muy importante entre la información 
termodinámica (la entropía) y la información de Shannon que se emplea en 
telecomunicación o cualquier otra rama de la ciencia. Me refiero a la enorme 
diferencia de magnitud entre ambas^6] 

Como hemos visto, la asociación entre entropía y probabilidad no sólo disipa 
el misterio, sino que reduce la segunda ley a una cuestión de mero sentido 
común. Quizá sea irónico que la visión atomista de la materia que nos ha llevado 
a una comprensión plena de la entropía generara de entrada un nuevo, y 
aparentemente más profundo, misterio. 


lEstá íntimamente asociada la segunda ley con la flecha del tiempo? 


A diario vemos numerosos procesos que aparentemente transcurren en un 
solo sentido, desde la mezcla de dos gases hasta la descomposición de un vegetal 
o animal muerto. Nunca observamos la inversión de estos fenómenos. Es casi 
natural pensar que el sentido en el que tienen lugar estos procesos, concordante 
con el transcurso del tiempo, es el correcto. Sobre esta cuestión. Brian Greene 
escribe^^: 

Damos por sentado que hay una dirección en el despliegue de las cosas en 
el tiempo. Los huevos se rompen, pero no se recomponen; las velas se 
funden, pero no se remodelan; las memorias son del pasado, nunca del 
futuro; la gente envejece, no rejuvenece. 

Pero Greene anade: 

Las leyes aceptadas de la física no exhiben semejante asimetría; las leyes 
tratan cada sentido del tiempo, adelante y atrás, por igual, sin distinción, lo 
que origina un enorme rompecabezas. 


jPor supuesto! Durante casi un siglo, los físicos han estado intrigados por el 


conflicto aparente entre la segunda ley de la termodinámica y las leyes de la 
dinámica^S] Como lo expresa Greene, « no sólo las leyes (de la física) 
conocidas no nos dicen por qué vemos desplegarse los acontecimientos en un solo 
orden, sino que nos dicen que, en teoría, podrían ir en el orden inverso. La 
cuestión crucial es por qué nunca vemos tal cosa. Nadie ha contemplado un 
huevo reventado desreventándose, y si esas leyes tratan igualmente el reventarse 
como el desreventarse, ^por qué ocurre lo primero y nunca lo segundo?» . 

Desde que Waddington asociara la segunda ley de la termodinámica con la 
flecha del tiempo, los científícos se han esforzado en resolver esta aparente 
paradoja. Las ecuaciones del movimiento son simétricas en cuanto al sentido del 
tiempo. Nada en ellas sugiere que un cambio deba ir en una dirección y no en la 
opuesta. Por otro lado, muchos procesos que vemos a diario proceden en una 
dirección y nunca en la opuesta. Ahora bien, i,está la segunda ley realmente 
asociada a esta flecha del tiempo? 

La respuesta clásica a esta pregunta es que si vemos una película al revés, 
enseguida nos daremos cuenta de que la acción está yendo hacia atrás, aunque 
no nos lo digan. Por ejemplo, si vemos que un huevo reventado en el suelo de 
pronto se recompone espontáneamente y salta para aterrizar intacto sobre la 
mesa, sonreiremos e invariablemente reconoceremos que la película está 
discurriendo al revés. ^Por qué? Porque sabemos que un proceso de esta clase no 
puede retroceder en el tiempo. 

Pero iy si un día nos sentamos en la cocina, vemos un huevo reventado en el 
suelo, y de pronto el huevo revierte a su estado entero y luego salta hasta Iograr 
situarse encima de la mesa? 

Por fantástico que pueda parecer, nuestra asociación del proceso de rotura 
del huevo con la flecha del tiempo es tan fuerte que no creeríamos lo que viesen 
nuestros ojos, y probablemente miraríamos a nuestro alrededor para ver si 
alguien nos está enganando con algún truco. O, si entendemos la segunda ley, 
podríamos convencernos de que hemos tenido la inmensa fortuna de observar un 
proceso real, en el sentìdo del tìempo correcto, que es extremadamente raro pero 
no imposible. 

Se trata de Ia misma conclusión a Ia que llega el físico del libro de George 
Gamow, Brevìario del senor Tòmphins en elpaís de las maravillas^- 149] Cuando el 
personaje de Gamow ve que el whisky de su vaso comienza a hervir 
espontáneamente por arriba, a la vezque se forman cubitos de hielo por debajo, 
sabe que este proceso, aunque extremadamente improbable, puede ocurrir de 
hecho. Puede que se asombre de observar un suceso tan extraordinario, pero no 
busca a ningún operador que esté pasando al revés la « película» de su vida. He 
aquí ese delicioso pasaje del libro de Gamow: 


E1 líquido en el vaso se cubrió de un burbujeo violento, y una tenue nube 
de vapor comenzó a ascender lentamente hacia el techo. Pero lo que 
resultaba particularmente extrano es que la bebida estuviera hirviendo 
sólo en una franja comparativamente pequena en torno al cubo de hielo. 

E1 resto de la bebida seguía estando bastante fría. « jPiensen en ello!», 
continuó el profesor con voz temblorosa. «Les estaba hablando de 
fluctuaciones estadísticas en la ley de la entropía, ;y ahora mismo 
estamos viendo una!». Por un azar increíble, posiblemente por primera 
vez desde que la Tierra comenzó a existir, las moléculas más veloces se 
han juntado todas accidentalmente en una parte de la superficie del agua, 
y el Iíquido ha comenzado a hervir por sí solo. En los miles de millones de 
anos que vendrán, probablemente seguiremos siendo las únicas personas 
que han tenido la oportunidad de observar un fenómeno tan 
extraordinario. E1 profesor miró la bebida, que ahora se estaba enfriando 
lentamente. « jVaya golpe de suerte!» , exclamó feliz. 

Pero nuestra asociación de los procesos espontáneos con la flecha del tiempo 
no es más que una ilusión. Una ilusión creada por el hecho de que nunca en la 
vida hemos visto un proceso que transcurra «en sentido contrario». La 
asociación de la ocurrencia natural de los procesos espontáneos con la flecha del 
tiempo es casi siempre váhda (casi siempre, pero no absolutamente siempre). 

En su delicioso libro, George Gamow intentó explicar los resultados difíciles 
de aceptar de la teoría de la relatividad y de la mecánica cuántica narrando las 
aventuras de un físico, el senor Tompldns, en un mundo donde uno podía ver y 
experimentar dichos resultados. Gamow intentó imaginar cómo se vería el 
mundo si la velocidad de la luz fuera mucho menor a 300 000 000 metros por 
segundo, o cómo vería el mundo alguien que viajara a velocidades próximas a la 
de la luz. En ese mundo uno podría contemplar fenómenos que casi nunca se 
experimentan en el mundo real. 

Similarmente, podemos imaginar un mundo donde la constante de Planck(A) 
fuera muy grande, y donde experimentaríamos fenómenos increíbles como, por 
ejemplo, atravesar tranquilamente una pared (efecto túnel) y otros fenómenos 
por el estilo que nunca experimentamos en el mundo real donde vivimos. 

Tomando prestada una de las fantasías de Gamow, podemos imaginar un 
mundo donde la gente vive mucho tiempo, mucho más que la edad del universo, 

digamos 10^^ aiiost^^. 

En un mundo así, al realizar el experimento de la expansión de un gas, o el de 
la mezela de gases, deberíamos ver algo parecido a lo que hemos observado con 
el sistema de diez dados. Si comenzamos con todas las partículas en un 
comparthnento, primero observaremos una expansión hasta que las partículas 


ocupen todo el volumen del sistema. Pero «de vez en cuando» también 
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observaremos visitas al estado original. ^Cuán a menudo? Si vivimos 10 1U anos 
y el gas contiene alrededor de 10 ^ partículas, entonces deberíamos observar 
visitas al estado original muchas veces a lo largo de nuestra vida. Si viéramos una 
película del gas en expansión, no reconoceríamos si va hacia delante o hacia 
atrás. No tendríamos la sensación de que unos fenómenos son más naturales que 
otros, por lo que no deberíamos tener un sentido de « flecha del tiempo» 
asociado con el incremento (o decremento ocasional) de la entropía. Así pues, el 
hecho de que no observemos la restauración espontánea de un huevo roto o la 
separación espontánea de dos gases no se debe a que exista un conflicto entre la 
segunda ley de la termodinámica y las ecuaciones del movimiento o las leyes de 
la dinámica. No hay tal conflicto. Si viviéramos « lo sufíciente» , llegaríamos a 
ver estos procesos invertidos. La conexión entre la flecha del tiempo y la segunda 
ley no es absoluta, sino sólo «temporal», a una escala de unos pocos miles de 
millones de afios. 

Habría que afiadir que en el contexto de la asociación de la segunda ley con 
la flecha del tiempo, algunos autores invocan la experiencia humana que 
distingue el pasado del futuro. Es cierto que recordamos sucesos del pasado, 
nunca del futuro. También sabemos que podemos influir en los sucesos futuros, 
pero nunca en los pasados. Comparto plenamente estas experiencias. La única 
pregunta que me hago es qué tiene que ver esta experiencia humana con la 
segunda ley, o con cualquier otra ley de la física. 

Esto nos lleva a la sección siguiente. 


^Es la segunda ley de la termodinámica una ley fisica? 


En la mayoría de textos de mecánica estadística se remarca que la segunda 
ley no es absoluta. Hay excepciones. Aunque es extremadamente raro que 
ocurra, la entropía puede disminuir « de vezen cuando» . 

A propósito de este aspecto de la segunda ley, Greene dice que « no es una 
ley en el sentido convencional» . Como cualquier ley de la naturaleza, la segunda 
ley de la termodinámica tiene una base experimental. Su formulación en 
términos del incremento de entropía recoge, de manera muy sucinta, el rasgo 
común de un enorme número de observaciones. En su formulación 
termodinámica o, mejor, no atomista, la segunda ley no admite excepciones. 
Como cualquier otra ley física, se declara absoluta, sin excepciones. Pero cuando 
la contemplamos desde el punto de vista molecular, nos damos cuenta de que 
admite excepciones. Aunque sea un suceso raro, extremadamente raro, la 



entropía puede bajar en vezde subir. Se reconoce así el carácter no absoluto de la 
segunda ley. De ahí el comentario de Greene de que no es una ley « en el sentido 
convencional», porque parece ser « menos absoluta» que las otras leyes de la 
física. 

Ahora bien, ^qué es una ley en el sentido convencional? ^JEs absoluta la ley de 
Newton de la inercia? ^Es absoluta la constancia de la velocidad de la luz? 
^Podemos realmente afirmar que una ley física es absoluta? Sabemos que estas 
leyes no han dejado de cumplirse en los pocos milenios durante los cuales se han 
registrado observaciones. Podemos extrapolarlas a millones o miles de millones 
de anos examinando el registro geológico o las radiaciones emitidas desde poco 
después del « big bang», pero no podemos afirmar que dichas leyes han sido 
siempre las mismas, o lo seguirán siendo en el futuro, sin excepciones. Todo lo 
que podemos decir es que es improbable que en los próxhnos millones o miles de 
millones de anos encontremos alguna excepción de alguna ley de la física. De 
hecho, no hay ninguna razón, ni teórica ni experimental, para creer que las leyes 
de la fïsica son absolutas. 

Desde este punto de vista, la segunda ley ciertamente « no es una ley en el 
sentido convencional» , pero esto no la debilita, como sugiere Greene, sino que la 
fortalece. 


E1 hecho de que admitamos la existencia de excepciones a la segunda ley la 
hace más « débil» que otras leyes de la física sólo cuando esas otras leyes se 
consideran válidas en un sentido absoluto. Pero el reconocimiento de la extrema 
rareza de las excepciones a la segunda ley no sólo la fortalece, sino que la 
convierte en la más poderosa de todas las leyes físicas. De cualquier ley física 
podemos afírmar que no se esperan excepciones al menos a 10^ anos vista. 
Pero las excepciones a la segunda ley sólo son esperables una vez cada 
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Así pues, la segunda ley es absoluta y no admite excepciones cuando se 
formula en el marco de la termodinámica clásica (no atomista). Pero cuando se 
formula como sucesos moleculares, su violación está permitida. Aunque suene 
paradójico, la « debilidad» relativa de la formulación atomista convierte a la 
segunda ley en la más fuerte de todas las leyes físicas, incluyendo la propia 
segunda ley en su formulación termodinámica (no atomista). En otras palabras, 
el carácter no absoluto que hemos aceptado de la segunda ley en su versión 
atomista es de hecho más absoluto que el pretendido carácter absoluto de la 
segunda ley en su versión no atomistat^*]. 

En el contexto de la cosmología moderna, la gente especula sobre el sombrío 
destino del universo, que acabará alcanzando un estado de equilibrio térmico o 
« muerte térmica» . :;,Podría no ser así?! 


En el otro extremo de la escala de tiempo, se ha especulado que, si admitimos 
que la entropía siempre aumenta, entonces, en el « principio» , el universo debe 
haber partido de un valor de entropía más bajo. 
j^Podría no ser así?! 

Además, esta última especulación entra en conflicto directo con la Bibha: 

1 En el principio Dios creó el cielo y la tierra. 

2 Y la tierra estaba sin formar y vacía. 


(Génesis 1, 1-2). 
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La versión original hebrea incluye la expresión tohu va bohu, en vez de « sin 
formar y vacía» . La interpretación tradicional de tohu va bohu es « caos totai» , 
o «desorden total» , o si se prefiere, jmáxima entropía! 

Dicho esto, me aventuraría a proponer la provocativa idea de que la segunda 
Iey de la termodinámica no es ni más « débil» ni más « fuerte» que las otras 
leyes de Ia física. Simplemente, no es una ley física, sino más bien un enunciado 
de puro sentido común. 

Esto me lleva a la última cuestión. 


iPodemosprescindir de la segunda ley? 


Si la segunda ley de la termodinámica no es más que un enunciado de sentido 
común, ^debemos incluirla entre las leyes de Ia física y ensenarla como tal? 
Parafraseando esta pregunta, supongamos que nadie hubiera formulado nunca la 
segunda ley de la termodinámica: ^podríamos derivarla puramente por inducción 
Iógica y sentido común? Mi respuesta es que probablemente sí, siempre que 
hubiéramos descubierto la naturaleza atómica de la materia y el inmenso 
número de partículas indistinguibles que constituyen cada pedazo de materia. 
Creo que se puede deducir la segunda ley de abajo arribat^] Desde luego 
podemos hacerlo en el caso shnple de la expansión de un gas o la mezcla de dos 
gases diferentes (como hemos hecho al final del capítulo 7). Si desarrolláramos 
unas matemáticas altamente sofisticadas, también podríamos predecir el destino 
más probable de un huevo que cae al suelot^^. Pero todas estas predicciones 


no se basarían en las leyes de la física, sino en las de la probabilidad, o lo que es 
lo mismo, en las leyes del sentìdo común. 

Se puede objetar justificadamente que si yo consiguiera hacer tales 
« predicciones» sería porque me he beneficiado de los hallazgos de Carnot, 
Clausius, Kelvin, Boltzmann y otros, por lo que «predecir» un resultado que 
conocemos de antemano no sería una gran hazana. Esto probablemente es cierto, 
así que reformularé la pregunta anterior. Supongamos que ninguno de los grandes 
científicos que fundaron la segunda ley hubiera existìdo, o que, caso de existir, 
nunca hubieran formulado la segunda ley. ^LIegaría la ciencia a la segunda Iey a 
través del puro razonamiento lógico, presuponiendo el conocimiento actualmente 
disponible de la naturaleza atómica de la materia y el resto de la física? 

La respuesta a esta pregunta quizá sea jNO! No porque no se pueda derivar la 
segunda ley de abajo arriba aunque la derivación de arriba abajo nunca hubiera 
existido, sino porque la ciencia encontrará innecesario formular una Iey fïsica 
basada en la pura deducción lógica. 

50 % 



Fin del libro. 
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Notas 



[1] Éste fue otro tema fascinante al que acabé dedicando mi tesis doctoral. « 


En la página de la dedicatoria se muestra una imagen. « 


Greene, B. (1999, 2004).« 


M Greene, B. (2004), pág. 12. « 


^ En mecánica estadística estos términos corresponderían a microestados y 
macroestados. En la mayor parte del libro tratamos con dados, y los dados son 
objetos macroscópicos. Por eso he preferido los términos «específico» e 
« inespecífîco» en vezde « microestado» y « macroestado» . « 


Morowitz(1992). pág. 69. « 


Véase Ben-Naim (2007). « 


[ g l Greene. B. (2004).« 


[9] Por formulación « no atomista» se entiende la discusión de la segunda ley sin 
ninguna referencia a la constitución atómica de la materia. A veces también se 
dice que Ias formulaciones de esta clase contemplan la materia como un 
continuo. Lo importante aquí es que tales formulaciones emplean sólo 
magnitudes macroscópicamente observables o medibles, sin referencia alguna a 
la constitución atómica de la materia. Esto no implica que las formulaciones no 
atomistas no valgan para la materia particulada. Como luego veremos, si la 
materia fuera en verdad continua y no estuviera constituida por átomos, la 
segunda ley no existiría. « 


Esta es la opinión mayoritaria, aunque algunos autores citan a Carnot corao 
el« inventor» o « descubridor» de la segunda ley. « 


Técnicamente, se dice que los procesos son cuasiestáticos. A veces también 
se habla de procesos reversibles, aunque este término se aplica también a otro 
tipo de procesos donde la entropía no cambia. Por eso es más apropiado y 
preferible hablar de procesos cuasiestáticos. « 


[12] «Reflexiones sobre la potencia motriz del fuego y las máquinas ajustadas 
para desarrollar esta potencia» , por Sadi Carnot(1824). « 


La segunda ley también puede formularse como la expansión espontánea de 
un gas. Como puede demostrarse, ésta y otras formulaciones también son 
equivalentes a las de Clausius y Kelvin. « 


[14] Citado por Cooper (1968). « 


Por «tener sentido» se entiende aquí que se trata de una experiencia 
corriente, y no necesariamente una consecuencia lógica. « 


« Siempre» en el dominio de los fenómenos que eran obj eto de estudio en la 
época, lo que ahora conocemos como mecánica clásica. « 


p ara una fascinante mirada a la biografía de Boltzmann, véase Broda 
(1983), Lindley (2001) y Cercignani (2003). « 


[18] p or e j em pl 0 , Loschmidt escribió en 1876 que la segunda ley no puede ser 
resultado de un principio puramente mecánico. « 


Como ha senalado Greene (2004), hay que hacer notar que la « simetría 
temporal» no quiere decir que el tiempo mismo se invierta o dé marcha atrás, 
sino que se refiere a si los sucesos que tienen lugar en el tiempo con un orden 
temporal particular también pueden ocurrir en el orden inverso. Una expresión 
más adecuada podría ser « inversión de sucesos» o « inversión de procesos» . « 


En el marco de la mecánica clásica.« 


Como veremos en los capítulos 7 y 8, el carácter no absoluto que hemos 
admitido de la formulación atomista de la segunda ley es de hecho más absoluto 
que el de la formulación no atomista. Sobre este asunto, Poincaré comentó: « ... 
para ver la transferencia de calor de un cuerpo frío a uno caliente, no será 
necesario tener la visión aguda, la inteligencia y la destreza del demonio de 
Maxwell; bastará con un poco de paciencia» (citado por Leff y Rex, 1990). « 


[22] Es interesante seiialar que los fundadores de la teoría cinética de los gases, 
como Maxwell, Clausius y Boltzmann, nunca publicaron ninguna explicación del 
movimiento browniano. « 


[23] Curiosamente, Einstein, quien elogiaba a Boltzmann por su interpretación 
probabilística de la entropía, nunca aceptó la interpretación probabilística de la 
mecánica cuántica.« 


[24] y na buena exposición de la teoría einsteiniana del movimiento browniano 
puede encontrarse en el libro de John Ridgen (2005). Una discusión completa y 
autorizada de la teoría del movimiento browniano, incluyendo el trasfondo 
histórico, ha sido publicada por Robert Mazo (2002). « 


Quizá cabe mencionar que en el marco de las últimas teorías de los agujeros 
negros se habla de la «segunda ley de la termodinámica generalizada». 
(Betenstein, 1980). A mí me parece que esta generalización no afecta a la 
fórmula de Boltzmann. « 


[26] Hoy día, cualquier libro de física, en partìcular de mecánica estadístìca, da 
por sentada la estructura atómica de la materia. Es interesante senalar que uno de 
los primeros supuestos del libro Statistical Thermodynamics de Fowler y 
Guggenheim (publicado en 1939 y reimpreso en 1956) era: « Supuesto I: La 
constitución atómica de la materia» . Los autores anaden el siguiente comentario: 
« Hoy esto apenas puede considerarse un supuesto, pero es relevante comenzar 
recordando que se hace, ya que cualquier referencia a las constìtuciones 
atómicas es ajena a la termodinámica clásica» . Ningún libro actual de mecánica 
estadístìca explícita este supuesto, porque la naturaleza atómica de la materia es 
un hecho universalmente aceptado. « 


[27] p ara simplificar y concretar, piénsese en N partículas distribuidas en M 
casillas. Una descripción completa del estado del sistema consiste en una 
especificación detallada de qué partícula está en qué casilla. « 


La asociación de la entropía con el desorden se debe probablemente a 
Bridgman (1941, 1953). Guggenheim (1949) sugirió el término « dispersión» 
para describir la distribución entre gran número de estados cuánticos posibles. 
Una discusión exhaustiva de este aspecto puede encontrarse en Denbigh y 
Denbigh (1985). « 


[29] La teoría de la información fue concebida sin conexión con la 
termodinámica por Claude Shannon en 1948. Más adelante se vio que la medida 
de información de Shannon es idéntica (salvo una constante que determina las 
unidades) a la entropía de Boltzmann. « 


Es interesante senalar que la palabra «adivinar», derivada del latín 
adivinare, contiene la raíz « divino» . Cuando decimos que hemos « adivinado» 
algo no estamos dando a entender que poseemos la facultad de predecir sucesos, 
pero originalmente el término adivinare probablemente sí implicaba un poder 
divino para predecir el resultado de una experiencia o un juego. Apropósito de 
esta creencia, Bennett (1998) escribe: « Los antiguos creían que lo que ocurría 
estaba controlado en última instancia por una deidad, no por el azar. E1 uso de 
mecanismos de azar para solicitar la dirección divina se conoce como 
adivinación, y el paso adoptado para asegurar la aleatoriedad tenía como único 
objetivo eliminar la posibilidad de interferencia humana, para así poder discernir 
la voluntad de la deidad» . « 


[31] Hay otro significado de probabilidad más general, como medida de la 
plausibilidad de una proposición, dada cierta información o evidencia (Carnap, 
1950, 1953; Jaynes, 2003). Emplearemos el término « probabilidad» tal como se 
hace en física. Siempre consideraremos sucesos, no proposiciones. No 
entraremos en la cuestión del significado de la probabilidad, la aleatoriedad, 
etcétera. Este tema se adentra en la filosofía. Como veremos en este capítulo, las 
preguntas sobre probabilidades siempre atanen a la probabilidad condicional. A 
veces la condición se formula como un suceso que ha ocurrido o tiene que 
ocurrir. Otras veces la condición puede contener una información o conocimiento 
acerca del suceso. Sin ningún conochniento es imposible responder a ninguna 
pregunta sobre probabilidades. « 


Hay que decir que «objetiva» aquí no implica « probabilidad absoluta» . 
Toda probabilidad es condicionada, o sea, es relativa a una información o 
evidencia dada. Sólo es objetiva en el sentido de que, dada la misma 
información, todo el mundo estimaría la misma probabilidad. D’Agostini (2003) 
prefiere « inter-subjetividad» a « objetividad» , mientras que otros hablan de 
probabilidad « menos subjetiva» . « 


[33] Como me comentó uno de los lectores del borrador de este libro, hay una 
tendencia a concluir que la estimación del 1% es más « acertada» que la del 
90%. Esto es cierto si empleamos el término « probabilidad» coloquialmente. 
Pero aquí nos interesa el significado científico de la probabilidad. Supongamos 
que estimo que Ia probabilidad de obtener el resultado « 4» al lanzar un dado es 
del 90%, y el lector estima que la probabilidad es del 1%. Lanzamos el dado y 
sale « 4» (o « 2», o cualquier otro resultado posible). ^Cuál era la estimación 
correcta? La respuesta es: jninguna! En este caso conocemos la probabilidad de 
ese suceso en particular, y el hecho de que se diera el suceso « sale un 4» en una 
única tirada no prueba nada acerca de su probabilidad. En nuestro ejemplo, la 
ocurrencia o no ocurrencia del suceso predicho (en este caso la aparición del 
Mesías el próximo lunes) no demuestra nada en relación con su probabìlidad. De 
hecho, no resulta evidente cómo defínir la probabilidad de tal suceso o siquiera si 
existe una probabilidad « correcta» del mismo. « 


[■^] Nótese que este enunciado suena altamente subjetivo. Pero cualquiera que 
tenga sentido común y quiera servirse de la teoría de la probabilidad debe 
aceptar esta subj etividad. « 


E1 uso del pasado o del futuro no implica que el tiempo intervenga en la 
definición de un suceso o de su probabilidad. « 


[■^] sólo consideraremos espacios muestrales finitos. La teoría de la probabilidad 
también maneja espacios infínitos o continuos, pero no los necesitamos en este 
Iibro. « 


[■^] Excluimos de la presente discusión la cuestión de que el dardo se clave 
exactamente en un punto concreto, o una línea, como puede ser el perímetro del 
círculo, cuya probabilidad es despreciable en la práctica y nula en teoría. 
Emplearemos, los diagramas de Venn sólo como ilustración. En los cálculos de 
probabilidades de los capítulos que siguen siempre manejaremos espacios 
muestrales finitos.« 


[38] E n realidad, estamos calculando la probabilidad condicionada de que el 
dardo se clave dentro del círculo, sabiendo que se clavará en el tablero. « 


[■^1 En matemáticas, la probabilidad es una medida definida para cada suceso, 
como la longitud, el área o el volumen de una región en una, dos o tres 
dimensiones, respectivamente. En el ejemplo de los diagramas de Venn, también 
tomamos el área de una región como medida de la probabilidad relativa. « 


[40] De hecho, el propio Kolmogorov era muy consciente de que eludía la 
cuestión del signifîcado o la definición de la probabilidad. Ahora se acepta casi 
universalmente que la probabilidad es un concepto primitìvo indefinible. Algunos 
autores de libros sobre probabilidad incluso se abstienen de definir el vocablo. « 


Algunos autores se oponen al uso del término « a priori» . Aquí lo usamos 
sólo en el sentido de que la evaluación de las probabilidades no depende de un 
experimento. A algunos autores tampoco les gusta el califícativo « clásica» . 
D’Agostini (2003) prefíere llamar «combinatorio» a este método. Hay que 
decir, no obstante, que la «combinatoria» es una rama concreta de las 
matemáticas que trata del número de modos de hacer ciertas cosas, y que, como 
tal, no tiene nada que ver con la probabilidad. Aun así, el método combinatorio se 
usa para calcular probabilidades conforme a la defínición clásica. « 


[42] p or supuesto, se supone no sólo que el dado es equitativo, sino que el método 
de su lanzamiento es «imparcial» o insesgado. La defìnición de un dado 
« equitativo» , o su lanzamiento « aleatorio» , también implica el concepto de 
probabilidad. También podríamos anadir que la teoría de la información ofrece 
una suerte de «justificación» para la elección de probabilidades iguales. La 
teoría de la información proporciona un método para la mejor estimación de las 
probabilidades basándose en lo que sabemos, todo lo que sabemos y nada más 
que lo que sabemos del experimento. « 


[43] En notación matemática, la definición es 

Pr(H\ = limite de n(H) 

' ' N(total)-> co N(total) 

Esto puede interpretarse de dos maneras. O se efectúa una secuencia de 
experimentos y se estima el límite de la frecuencia relativa cuando el número de 
experimentos se hace infinito, o se lanza un número infinito de monedas a la vez 
y se cuentan las caras que salen. Uno de los supuestos fundamentales de la 
mecánica estadística es que ambos métodos darán el mismo resultado. Esta 
hipótesis es la semilla de toda una rama de las matemáticas conocida como 
teoría ergódica. « 



[44] £) e hecho, creemos que éste es el resultado correcto aun sin hacer el 
experimento. Estamos convencidos de que, mediante un experimento mental, el 
resultado convergerá hacia la probabilidad correcta. Si, por ejemplo, hacemos el 
experimento de lanzar un dado y hallamos que la frecuencia del suceso « par» 
se acerca a 1/2, lo que es coherente con el resultado que hemos calculado 
aplicando la definición clásica, entonces la « corrección» de nuestra asignación 
de probabilidades contará con un respaldo adicional. « 


[45] En la figura 2.5 se han suprimido seis configuraciones (las enmarcadas por 
el rectángulo de puntos en la figura 2.4). Esto es así porque, a diferencia de las 
monedas o los dados, las partículas son indistinguibles. En la figura 2.6 se han 
suprimido otras cuatro configuraciones (las enmarcadas por el rectángulo de 
puntos y rayas en la figura 2.4). Esto es así porque la física prohíbe que dos 
partículas fermiónicas ocupen la misma casilla (es Io que se conoce como 
principio de exclusión de Pauli). Resulta que estas reglas se derivan de ciertos 
requerimientos de simetría sobre las funciones de onda del sistema de partículas. 
Por lo que sé, la asignación de probabilidades precedió al descubrimiento de los 
principios de simetría.« 


[46] Hay que decir que la introducción de la probabilidad condicionada y la 
independencia entre sucesos es exclusiva de la teoría de la probabilidad, y es lo 
que la diferencia de la teoría de conjuntos y la teoría de la medida. « 


[47] Nótese que la probabilidad condicionada sólo está definida para una 
condición cuya probabilidad es no nula. En el ejemplo anterior, se requiere que 
el suceso B no sea imposible. « 


[48] Aquí queremos subrayar el cambio en el grado de «objetìvidad» (o 
subjetividad) al pasar de la probabilidad de un suceso a la probabilidad 
condicionada. « 


[49] Aquí queremos subrayar el cambio en el grado de « obj etividad» (o 
subj etividad) al pasar de la probabilidad de un suceso a la probabilidad 
condicionada.« 


[50] p or e j em pio 5 i a probabilidad de sacar tres canicas rojas, cinco canicas 
aioiles y dos canicas verdes de una urna que contiene 100 canicas de cada color, 
300 en total, suponiendo que las canicas son idénticas, que sacamos 10 canicas al 
azar, etcétera. Éste es un problema algo más difícil, y puede que el lector no sea 
capaz de resolverlo, pero la probabilidad «está ahb> en el suceso mismo. De 
forma similar, la probabilidad de encontrar dos átomos separados por cierta 
distancia en un líquido a una temperatura y una presión dadas, suponiendo que 
conocemos y aceptamos las leyes de la mecánica estadística y que sabemos que 
dichas leyes han sido extremadamente útiles para predecir muchas propiedades 
medias de propiedades macroscópicas, etcétera, jes una probabilidad objetiva! 
Aunque no sepamos calcularla, sabemos que « está ahí» en el suceso. « 


Este ejemplo y el análisis de su implicación están extraídos de Falk(1979). 

« 


Shannon (1948). « 


Algunos autores prefieren referirse a la información desconocida como 
«incertidumbre» . Aunque me parece un término apropiado, personalmente 
prefiero hablar de «información desconocida» o «información» a secas. 
Pienso que en el contexto de la aplicación de la teoría de la información a la 
mecánica estadística, desarrollada de manera persuasiva por Jaynes (1983) y 
Katz(1967), la palabra « información» es preferible. « 


p or supuesto, hay muchas otras maneras de obtener esa información. 
Podemos preguntar « ^Dónde está la moneda?», o simplemente abrir todas las 
cajas y mirar dentro. Pero esto no se ajustaría a las reglas del juego. Hemos 
convenido en adquirir información sólo a base de preguntas binarias. « 


Nótese que la «probabilidad» no se definió, sino que se introdujo 
axiomáticamente. La información se define como probabilidad. La defínición 
general es: el sumatorio de Pr{i}logPr{i}, donde Pr{i} es la probabilidad del 
suceso i. Esto tiene la forma de un promedio, pero se trata de un promedio muy 
especial. « 


SiNes el número de posibilidades igualmente probables, entonces log 2 Nes 
el número de preguntas que tenemos que hacer para localizar la moneda; por 
ejemplo, para N= 8, log^ 8 = 3; para N= 16, log^ 16 = 4; para N= 32, log^ 32 = 
5; y así sucesivamente. « 


Nótese que se supone que las monedas son idénticas. Todo lo que 
necesitamos saber es qué cajas están ocupadas o, de forma equivalente, qué 
cajas están vacías.« 


La escritura explícita de esta clase de números no sólo requeriría un tiempo 
inimaginable, sino que podría ser que dicho lapso de tiempo no tuviera existencia 
física en absoluto. De acuerdo con la cosmología moderna, el tiempo podría 
haber comenzado con el « big bang» , hace 15 000 millones de anos, y podría 
terminar con el« big crunch» , si tal cosa sucede en el futuro. « 


sólo usaremos logaritmos de base 10, aunque en teoría de la información es 
más conveniente emplear logaritmos de base 2. « 


[60] Nótese que podemos distinguir entre partículas diferentes e idénticas. No 
podemos discriminar con ninguno de nuestros sentidos entre partículas idénticas e 
indistinguibles (de ahí que coloquialmente se consideren sinónimos). Adviértase 
también que podemos pasar de partículas diferentes a idènticas de manera 
continua, al menos en teoría, pero no podemos pasar de partículas idénticas a 
indistinguibles. Las partículas o son distinguibles o son indistinguibles. La 
indistinguibilidad no es algo que observemos en la vida diaria, sino que es una 
propiedad que la naturaleza impone a las partículas. « 


Los dos isómeros rotan la luz polarizada en distintas direcciones: / (de levo) a 
la izquierda y d (de dextro) a la derecha. « 


B por Boltzmann y Apor Arieh. « 


[63] La historia de estos y otros problemas probabilisticos de la primera época 
puede encontrarse en David (1962). « 


[^4] ei concepto « suceso inespecífico» se examinará en Ios capítulos siguientes. 

« 


[65] véase la nota 1 del capítulo 2. « 


[66] Aquí aplicamos el calificativo « inespecífico» a un suceso; los detalles de los 
sucesos específicos comprendidos en él no se tienen en cuenta. « 


[67] Más adelante partiremos de una configuración arbitraria. Para comenzar 
supondremos que la confíguración inicial es la de « todo ceros» . « 


E1 programa es muy simple. Primero elige un número de 1 a iV, y luego 
cambia aleatoriamente la cara del dado situado en esa posición para obtener un 
nuevo resultado. « 


[69] p or <( mano>> entenderemos una partida entera consistente en un número 
predeterminado de « pasos» . « 


[70] Como veremos en el capítulo 7, en la teoría molecular de la segunda ley, las 
configuraciones específicas e inespecíficas corresponden a los microestados y 
macroestados del sistema.« 


Nótese, sin embargo, que la línea de equilibrio no caracteriza ninguna 
configuración específica. De hecho, se trata de una configuración inespecífica 
consistente en el máximo de confíguraciones específicas para este juego en 
particular. E1 significado de la línea de equilibrio aquí se relaciona con (pero no es 
lo mismo que) el estado de equilibrio de un sistema termodinámico, tal como se 
discute en el capítulo 7. « 


[72] En los procesos reales, la temperatura es el principal determinante de la 
velocidad del proceso. Pero ni en este juego ni en los procesos reales nos 
fijaremos en este parámetro (véase también el capítulo 7). « 


[73] Recientemente se ha cuestionado incluso la constancia de las constantes 
físicas. En realidad no sabemos si constantes como la velocidad de la luzcambian 
o no a una escala de tiempo cosmológica (véase Barrow y Webb, 2005). « 


[74] Desde un punto de vista físico, el resultado es una onda electromagnética de 
cierta frecuencia. Esta onda específíca penetra en el ojo y es enfocada en los 
conos retinianos, que envían un mensaje al cerebro, donde se procesa la 
información y percibimos esa senal como un color. « 


[75] L os resultados físicos son moléculas que son adsorbidas por receptores 
específicos estructuralmente complementarios situados en la superficie interna 
de la nariz. Desde ahí se transmite una senal al cerebro, donde es procesada para 
producir la percepción de un olor específïco. « 


[76] Como en el caso de los olores, el sentido del gusto proviene de moléculas 
estructuralmente específicas adsorbidas por células sensibles situadas en las 
papilas gustativas de la lengua. Desde ahí se envía un mensaje al cerebro, donde 
es procesado para producir Ia sensación del sabor. « 


[77] Desde un punto de vista fïsico, las ondas sonoras que inciden en el tímpano 
producen vibraciones que se transmiten al oído interno. Desde ahí se envía un 
mensaje al cerebro, donde la información se procesa para producir la sensación 
de un tono específíco. « 


E1 sentìdo del tacto corre a cargo de células nerviosas situadas bajo la piel 
que responden a la presión y la temperatura. Estas células envían mensajes al 
cerebro, donde se procesan para producir las sensaciones de presión, 
temperatura y quizá también dolor. « 


[79] E s te es un experimento extremadamente hipotético. En un experimento real 
que veremos en el capítulo 7, los dados serán reemplazados por partículas 
atómicas. Podemos imaginar moléculas de distintos colores, olores o sabores, 
pero no podemos asignar una «temperatura» a cada molécula. La temperatura 
que percibimos es consecuencia de la distribución de la energía cinética de las 
moléculas. Para simular algo parecido a un experimento real, deberíamos 
emplear dados con un número infinito de caras, que representarían las 
velocidades posibles de una molécula. « 


[80] También debemos presuponer un mecanismo que mantìene cada cara 
caliente y cada cara fría a la temperatura fijada. Aquí resulta bastante difícil 
impedir la transferencia de calor entre las distintas caras, así como mantener 
constante la temperatura de las caras tras tocarlas con las manos o con un 
termómetro. « 


Esto no es realmente necesario, pero 1 
comportamiento de la dentropía sea coherente co 
entropía real que examinaremos en el capítulo 7.« 


hacemos para que el 
el comportamiento de la 


[82] Una magnitud equivalente sería el cuadrado de n - N/2, es decir, (n - N/ 2)2. 

« 


[^3] Recordemos que empleamos los términos « siempre» y « nunca» en el 
sentido discutido al fínal del capítulo 4. « 


[84] E s to tampoco es esencial. Recordemos que, en el teoremaH de Boltzmann, 
la magnitud H también decrece hacia el equilibrio (véase el capítulo 1).« 


Si se quiere, se puede « normalizar» esta magnitud dividiéndola por N/2 para 
obtener una función que varía de cero a uno. « 


Como sólo nos interesa la variación de la entropía, basta con determinar la 
entropía hasta una constante aditiva, más una constante multiplicativa que 
determine las unidades de nuestra medida de la entropía. Véanse los capítulos 7 y 
8 . « 


[87] L a definición también se aplica al caso más general donde la descripción 
inespecífíca es « hay que muestran la cara A, «g que muestran la cara B, 
etcétera, en un sistema de JVdados» . « 


[88] Nótese que podemos hablar de «información» o de «información 
perdida» . La primera se aplica a la información que contiene el sistema. Nos 
referimos a la segunda cuando nos preguntamos cuánta información 
necesitaríamos adquirir para conocer el estado específico o la configuración 
específica.« 


Se puede demostrar que este número es log 2 AT, es decir, el logaritmo en base 
2 del número de dados. Nótese que, en este ejemplo, N es el número de dados y 
también el número de configuraciones específicas. « 


Nótese que la información perdida de la que hablamos aquí es una función 
estrictamente creciente de Ny de n (para n < Nl 2). A1 efectuar un experimento 
con dados, la información perdida que registramos se comporta como las 
gráficas que hemos visto en el capítulo 4 de la suma en función del número de 
pasos.« 


E1 número de preguntas es log^, W donde W = N}/(N~ «)! «! es el número 
total de maneras de obtener n « unos» (o caras de una moneda) en iVdados (o N 
casillas). Nótese que este número varía simétricamente en torno a n = N/2, donde 
W alcanza el valor máximo. « 


[92] Este aspecto ya fue discutido por Shannon (1948). Una exposición más 
detallada de este tema puede encontrarse en Ben-Naim (2007). « 


[93] En realidad, la entropía absoluta del sistema no interesa. Lo que importa, y 
lo que es medible, es la diferencia de entropía. « 


[94] Aquí hablamos de « sentído común» desde un punto de vista estrictamente 
lógico. Hasta hace muy poco, la teoría de la evolución estaba muy lejos de ser 
« de sentido común» . Esto sólo cambió tras el descubrimiento del ADN y la 
consiguiente comprensión del mecanismo de la evolución al nivel molecular. « 


[95] Un enunciado más corriente es: « E1 sistema evoluciona hacia el desorden» . 
Lo comentaremos en el capítulo 8. « 


[96] Nótese que hablo de los « sucesos inespecíficos» , en plural y no en singular, 
correspondientes a la línea de equilibrio. Éstos tienen una probabilidad máxima, 
ipero no son únicos! Los sucesos inespecíficos a los que me refiero son el 
correspondiente a la línea de equilibrio y los de su vecindad inmediata. « 


[97] Aquí nos referimos al estado de equilibrio en el sentido termodinámico, que 
no es exactamente lo mismo que la línea de equilibrio. Esta distinción quedará 
clara más adelante. « 


[98] Esta clase de proceso se conoce como proceso cuasiestático. Si la 
compuerta es lo bastante pequena, no necesitamos abrirla y cerrarla cada vez 
que pase un átomo. E1 estado del sistema no es de equilibrio, pero las magnitudes 
medibles, como densidad, temperatura, color, etcétera, cambiarán tan 
lentamente que será como si atravesáramos una secuencia de estados de 
equilibrio.« 


[99] véase, no obstante, lo que hemos dicho de los fermiones y los bosones en el 
capítulo 2. « 


[100] g n j a mec 4 n j ca clásica, si conocemos las posicionesy velocidades exactas 
de todas las partículas en un momento dado, en principio podríamos predecir las 
posiciones y velocidades de todas las partículas en cualquier momento futuro. 
Pero listar esta vasta cantidad de información no está a nuestro alcance, y menos 
aún resolver 10 ^ ecuaciones cinéticas. E1 notable éxito de la mecánica 
estadística es una prueba monumental de la adecuación del tratamiento 
estadístico para los sistemas constituidos por un número inmenso de partículas. 
« 


La predicción de las probabilidades a partir de la dinámica de las partículas 
plantea un problema profundo y difícil. Todos los intentos, de Boltzmann en 
adelante, han fracasado. En principio, no se pueden derivar probabilidades a 
partir de las ecuaciones deterministas de los movimientos de las partículas. Por 
otro lado, es bien sabido que un sistema con un gran número de partículas 
moviéndose al azar exhibe regularidades y comportamientos notablemente 
predecibles. « 


[102] p Qr su p ues t 05 un sistema así no es factible. La realización de un 
experimento semejante equivale a conocer exactamente la posición y velocidad 
de cada partícula en cualquier momento. « 


Los dos isómeros rotan el plano de la luz polarizada a la derecha (dextro) o 
a la izquierda (levo). « 


Este proceso se ha llamado desasimilación, esto es, el inverso del proceso 
de asimilación, definido como la pérdida de identidad de las partículas. En 
algunos libros de texto se describe erróneamente como un proceso de mezela. 
Para más detalles, véase Ben-Naim (1987, 2006). « 


Esto resulta intuitivamente evidente. Puesto que, aparte de ser imágenes 
especulares uno del otro, ambos isómeros son idénticos, no hay razón por la cual 
una forma deba predominar sobre la otra en el equilibrio. Por las mismas razones 
que en el caso del proceso de expansión, habrá más o menos el mismo número 
de partículas en D y en L (suponiendo que los volúmenes de ambos 
comparthnentos sean iguales). « 


[106] pj a y q ue se fj a j ar q ue en un sistema de gas ideal sólo hay dos tìpos de 
información: posiciones y velocidades. Las identidades de Ias partículas no 
constìtuyen una nueva clase de información. Pero el cambio de identidad sí 
contribuye a la variación de información (para más detalles, véase Ben-Naim, 
2007).« 


[107] sj em p re q ue hablamos de N/2 partículas, queremos decir en la vecindad de 

N/2.« 


[108] g n vez( j e j a probabilidad de que un átomo atraviese el agujero y pase de D 
a I, o de I a D, tenemos la probabilidad de que un isómero adquiera energía 
suficiente (a través de las colisiones) para pasar de la forma d a la forma l, y 
viceversa, o para combinarse con el catalizador, que inducirá la transformación 
de un isómero en otro. « 


[109] T am bién podríamos conseguir el mismo efecto mezclando dos gases 
diferentes, como en la fígura 1.4. En tal caso, el color (o el olor, o el sabor) se 
registrará continuamente pero no homogéneamente, como en el proceso descrito 
en esta sección. « 


Aquí hay que hacer una puntualización sutil. La información de la que 
estamos hablando es la situación de las partículas en I o D. Podríamos haber 
decidido dividir el sistema en un número mayor de celdillas menores, digamos 
cuatro en D y cuatro en I. En tal caso, la información del estado inicial es 
diferente, ya que estaremos especifícando qué partícula está en qué celdilla, lo 
mismo que la información del estado final. Sin embargo, la diferencia de 
información (y de entropía) es independiente de las divisiones internas, siempre 
que hagamos la misma subdivisión de ambos compartimentos (para más detalles, 
véase Ben-Naim, 2006, 2007). « 


En el libro de Brillouin (1962) se hace la chocante afirmación de que « la 
probabilidad tiende a aumentar» . Esto probablemente es un lapsus linguae. Lo 
que Brillouin seguramente quería decir es que sucesos de baja probabilidad 
evolucionan hacia sucesos de elevada probabilidad. Las probabilidades mismas 
no cambian.« 


I'' “ En general, esta iguaidad puede derivarse de la identidad« 

m 


(i+if=2 w =z: 0 


n!(N—n)! 



[113] p Qr (< cerca>> entendemos un porcentaje muy pequeno de N, digamos del 
0,001%. Estos estados son tan próximos que resultan indistinguibles 
experimentahnente. Si partimos de un sistema con exactamente N/2 elementos 
en cada compartimento, y luego suprimimos la separación, el número de estados 
aumenta de JV!/(M2)!(M2)! a 2^. Éste es un incremento enorme en el número de 
estados, pero, para N~ 10^, no apreciaremos ningún cambio en el sistema. Cada 
compartimento contendrá cerca de (pero no exactamente) N/2 partículas. « 


Aquí nos permitiremos suponer que las partículas pueden etiquetarse. « 


[114] 


[ 1Esta probabilidad es (2 N)\/(N\Ý‘ x 2 « 


[116] Nq p OC j emos distinguir entre estados inespecíficos os muy próximos (como 
entre N y N + 1, o N + 1000). Esta indistinguibilidad es diferente de la 
indistinguibilidad entre estados específicos pertenecientes al mismo estado 
inespecífico. En el primer caso la indistinguibilidad es en la práctica, mientras 
que en el segundo la indistinguibilidad es en principio. « 


[^7] Nótese de nuevo que, para definir la entropía de cada estado inespecífíco, 
tenemos que abrir y cerrar las compuertas entre los compartimentos en cada 
punto donde queremos calcular la entropía. De esta manera permitimos que el 
sistema proceda a través de una secuencia de estados de equilibrio. « 


[118 ] a veces la entropía se describe como una medida de la dispersión de la 
energía. Hay que decir que el término «dispersión», como «orden», es 
apropiado a veces, pero no siempre, como evidencia este ejemplo. « 


Shannon (1948, sección 20). Una discusión más detallada de este aspecto 
de la información perdida puede encontrarse en Ben-Nahn (2007). « 


[120] § e sobrentiende que el proceso es cuasiestático, esto es, la transferencia de 
calor es lo bastante lenta para que el equilibrio dentro de cada gas prácticamente 
se mantenga a cada paso. Podemos imaginar un pequeno agujero que permite el 
paso de gas de un compartimento a otro, similar al caso descrito en el proceso de 
expansión. También podemos imaginar un material conductor muy estrecho que 
conecte ambos sistemas. « 


[^1] Nótese que todo este conocimiento se supone aportado por la física. Es 
verdad, no obstante, que parte de este conocimiento se adquirió tras la 
formulación y el estudio de la segunda ley. Pero aquí presumimos que esta 
información no es dada de antemano. « 


Este supuesto tan extremo no es esencial, pero es más fácil pensar que sólo 
pasa una partícula de un compartimento a otro cada vez. « 


[1^3] Cuando digo « hasta que no se descubrió y aceptó» quiero decir que aún no 
se había descubierto y aceptado. Si la materia no consistiera en átomos y 
moléculas, no habría habido misterio, porque no se daría ninguno de los 
fenómenos descritos. La segunda ley, tal como se formuló en el marco de la 
termodinámica clásica, no habría existido. « 


[124] <K j ener sentido» no debe entenderse aquí en el sentido lógico, sino en el de 
la experiencia común y corriente. « 


[125] y£ ase e j C apítulo 1, página [31]. Volvemos a citar las palabras de Clausius 
sobre la elección del término « entropía» . Clausius dice: « Propongo llamar a S la 
entropia de un cuerpo, que en griego significa transformación. « 


[126] Según la definición del Merriam-Webster’s Collegiate Dictionary (2003). 

« 


t 127 ] Greene (2004).« 


[128] y na excepción es el libro de Gamow Un, dos tres, infinito, que abre una 
sección con el titulo« La misteriosa entropía» , pero acaba así: « Como puede 
verse, no hay nada en ella que deba asustarnos» . « 


t 129 ] Atkins (1984). « 


Es interesante senalar que « entropía» y « la segunda ley» figuran en los 
títulos de cientos de libros (véase la bibliografía). Hasta donde yo sé, ninguna otra 
Iey de la física ha tenido el mismo tratamiento. « 


t 131 ] Atkins (1984). « 


t 132 ] Penrose (1989, 1994).« 


[133] yé ase \ a no ta 1 de este capítulo. « 


[134] Además, Shannon construyó la medida de la información, o la 
incertidumbre, requiriendo que cumpliera ciertas condiciones. Estas condiciones 
son plausibles para la información, pero no para el desorden. Para leer más sobre 
este aspecto de la entropía, véase Ben-Naim (2007). « 


[135] p ara j a Jnterpretación de la entropía sobre la base de la teoría de la 
información, véase Jaynes (1983). « 


[^6] l os microestados y macroestados a que nos referimos aquí son lo que 
hemos llamado estados (o configuraciones, o sucesos) especificos e inespecificos. 

« 


t 137 ] Atkins (1984). « 


[138] p Qr <( adimensionai» se entiende carente de unidades. « 


[1-^] £ sta jdentidad tìene la forma (para partículas atómicas de masa m) 3kT/2 = 
m< v^>/2, donde T es la temperatura absoluta, < v^> es el promedio de los 
cuadrados de las velocidades atómicas, y kes Ia misma kque figura en la tumba 
de Boltzmann. « 


[140] 0 ,^ est0 j a reJación 3£772 = m< v^>/2 se simplifica: 3T/2 = m< v^>/2. La 
constante R en la ecuación de estado para los gases ideales se transformaría en el 
número de Avogadro N^y = 6,022 x 10^, y la ecuación de estado de un mol de 
gas ideal sería PV= N^yT en vezde PV= RT. « 


[^1] L a fórmula de Boltzmann presupone que conocemos las configuraciones 
que cuentan en W. Hasta donde yo sé, esta ecuación no se discute en el marco de 
la termodinámica no relatìvista. En el caso de la entropía de un agujero negro, lo 
cierto es que no se sabe si esta relación es válida. Debo este comentario a Jacob 
Bekenstein.« 


[142] Tribusy Mclrvine (1971). « 


[1^3] Como de hecho se hace en muchos campos de la física. « 


[144] Nàtese que la entropía seguiría siendo una magnitud extensiva, esto es, 
sería proporcional al tamano del sistema. « 


[145] Qtajo p Qr j aco b Betenstein (2003). « 


[146] y na p re g un t a binaria proporciona un bit (una unidad binaria) de 
información. Un libro típico contiene alrededor de un millón de bits. Se estima 
que todo el material impreso en el mundo contiene unos 10^ bits. En mecánica 
estadística se manejan cantidades de información del orden de 10 ^ y más bits. 
Podemos defínir la información en dólares o euros. Si comprar un bit de 
información costara un céntimo, entonces la información de un libro típico 
costaría un millón de céntimos, o 10 000 euros. jTodo el dinero del mundo no nos 
alcanzaría para comprar la información contenida en un gramo de agua! « 


[147] Q reene (2004, pág. 13). « 


[148] Aq U ; nos referimos a las leyes clásicas (newtonianas) o mecanocuánticas 
de la dinámica, que tienen simetría temporal. Hay fenómenos en el mundo de las 
partículas elementales que no son reversibles en el tiempo, pero nadie cree que 
constituyan las raíces de la segunda ley. Debo este comentario a Jacob 
Bekenstein. « 


t 149 ] Gamow (1940, 1999). « 


[150] jj a b r í a q ue decir q uej hasta donde sabemos, no hay ninguna ley natural 
que limite la longevidad de las personas o de cualquier sistema vivo. Podría ser 
que alguna simetría fundamental lo excluyera. Pero esto podría valer también 
para la velocidad de la luzo la constante de Planck Si así fuera, entonces ninguna 
de las fantasías de Gamow podría realizarse en cualquier « mundo» donde la 
velocidad de la luzo la constante de Plancktuviesen valores distintos. « 


Aunque mis conocimientos de cosmología son mínimos, creo que lo que he 
expuesto en esta sección es también aplicable a la « segunda ley generalizada» 
que se usa en conexión con la entropía de un agujero negro (véase Bekenstein, 
1980).« 


[^2] ç on es to no quiero decir que uno puede deducir la segunda ley resolviendo 
las ecuaciones del movimiento de las partículas, sino a partir del comportamiento 
estadístico del sistema. Lo primero es impracticable para números de partículas 
delordende 10^.« 


[153] j) e n uevo, no pretendo predecir el comportamiento del huevo que revienta 
resolviendo las ecuaciones dinámicas de todas las partículas que lo integran. Pero 
en principio, conociendo todos los grados de libertad posibles de todas las 
moléculas componentes, podríamos predecir el destino más probable del huevo. 


